Isi kandungan:
- Melibatkan semua bahagian perniagaan dalam inisiatif data yang besar
- Adakah menilai semua model infrastruktur untuk pelaksanaan data besar
- Lakukan pertimbangkan sumber data tradisional dalam perancangan data besar
- Adakah mempertimbangkan satu set data yang konsisten
- Adakah mengedarkan data
- Jangan sekali-kali bergantung pada satu pendekatan analisis data besar
- Jangan memulakan inisiatif data besar sebelum anda siap
- Jangan gunakan data secara berasingan
- Jangan abaikan keselamatan data
- Jangan abaikan bahagian prestasi analitik data besar
Data besar membawa banyak janji untuk semua jenis industri. Sekiranya data besar ini dimanfaatkan dengan berkesan dan cekap, ia boleh memberi impak besar dalam membuat keputusan dan analisis. Tetapi manfaat data besar hanya dapat dicapai jika ia diuruskan dengan cara terstruktur. Amalan terbaik data besar secara beransur-ansur diwujudkan, tetapi sudah ada beberapa perkara yang jelas dan tidak perlu apabila dilaksanakan.
Panduan berikut adalah berdasarkan kepada pengalaman praktikal dan pengetahuan yang dikumpulkan dari projek kehidupan sebenar. Inilah data besar saya dan tidak perlu.
Melibatkan semua bahagian perniagaan dalam inisiatif data yang besar
Inisiatif data yang besar bukan aktiviti terpencil dan bebas, dan penglibatan semua unit perniagaan adalah suatu keharusan untuk mendapatkan nilai dan wawasan yang sebenar. Data besar boleh membantu organisasi memanfaatkan jumlah data yang besar dan memperoleh pandangan tentang tingkah laku pelanggan, peristiwa, trend, ramalan, dll. Ini tidak mungkin dengan snapshot data, yang hanya menangkap sebahagian daripada keseluruhan jumlah data yang diproses dalam data besar. Akibatnya, syarikat semakin menumpukan perhatian pada semua jenis data yang datang dari semua saluran / unit perniagaan yang mungkin untuk memahami corak yang betul.Adakah menilai semua model infrastruktur untuk pelaksanaan data besar
Jumlah data dan pengurusannya adalah kebimbangan utama untuk setiap inisiatif data yang besar. Oleh kerana data besar berkaitan dengan petabytes data, satu-satunya penyelesaian untuk mengurusnya adalah dengan menggunakan pusat data. Pada masa yang sama, komponen kos perlu dipertimbangkan sebelum memilih dan memuktamadkan mana-mana kemudahan penyimpanan. Perkhidmatan awan selalunya pilihan terbaik, tetapi perkhidmatan persekitaran awan yang berbeza harus dinilai untuk menentukan yang sesuai. Oleh kerana penyimpanan adalah salah satu komponen terpenting dalam mana-mana pelaksanaan data besar, ia adalah faktor yang harus dinilai dengan sangat hati-hati dalam setiap inisiatif data besar. (Dapatkan perspektif lain dalam Cabaran Data Besar Hari Ini Bermula dari Pelbagai, Bukan Jumlah atau Kelajuan.)Lakukan pertimbangkan sumber data tradisional dalam perancangan data besar
Terdapat pelbagai sumber data besar dan jumlah sumber juga semakin meningkat setiap hari. Jumlah besar data ini digunakan sebagai input kepada pemprosesan data yang besar. Akibatnya, sesetengah syarikat berfikir bahawa sumber data tradisional tidak berguna. Ini tidak benar, kerana data tradisional ini merupakan komponen penting untuk kejayaan mana-mana kisah data yang besar. Data tradisional mengandungi maklumat yang berharga, jadi ia harus digunakan bersamaan dengan sumber data besar lain. Nilai sebenar data besar hanya boleh diperoleh jika semua sumber data (tradisional dan tidak tradisional) diambil kira. (Ketahui lebih lanjut dalam Take That, Big Data! Mengapa Data Kecil Dapat Punch Punch Lebih Besar.)Adakah mempertimbangkan satu set data yang konsisten
Dalam persekitaran data yang besar, data datang dari pelbagai sumber. Format, struktur dan jenis data berbeza dari satu sumber ke yang lain. Bahagian yang paling penting ialah data tidak dibersihkan ketika datang ke persekitaran data besar anda. Jadi, sebelum anda mempercayai data yang masuk, anda perlu menyemak konsistensi dengan pemerhatian dan analisa berulang. Apabila konsistensi data disahkan, ia boleh dianggap sebagai set metadata yang konsisten. Mencari set metadata yang konsisten dengan pemerhatian yang teliti terhadap corak adalah latihan penting dalam perancangan data yang besar.Adakah mengedarkan data
Jumlah data adalah kebimbangan utama apabila kita mempertimbangkan persekitaran pemprosesan. Oleh kerana jumlah besar data yang berkaitan dengan data besar, pemprosesan pada satu pelayan tidak mungkin. Penyelesaiannya adalah persekitaran Hadoop, yang merupakan persekitaran pengkomputeran yang diedarkan yang menggunakan perkakasan komoditi. Ia memberi kuasa pemprosesan yang lebih cepat pada pelbagai nod. (Ketahui lebih lanjut dalam 7 Perkara Yang Tahu Mengenai Hadoop.)Jangan sekali-kali bergantung pada satu pendekatan analisis data besar
Terdapat pelbagai teknologi yang terdapat di pasaran untuk memproses data besar. Dasar semua teknologi data besar adalah Apache Hadoop dan MapReduce. Oleh itu, adalah penting untuk menilai teknologi yang betul untuk tujuan yang betul. Beberapa pendekatan analisis penting ialah analisis ramalan, analisis preskriptif, analisis teks, analisis data aliran, dan sebagainya. Pemilihan kaedah / pendekatan yang sesuai adalah penting untuk mencapai matlamat yang diingini. Adalah lebih baik untuk menghindari bergantung pada satu pendekatan, tetapi untuk menyiasat pelbagai pendekatan dan pilih perlawanan yang sempurna untuk penyelesaian anda.Jangan memulakan inisiatif data besar sebelum anda siap
Ia sentiasa disyorkan untuk memulakan langkah-langkah kecil untuk setiap inisiatif data yang besar. Jadi, mulakan dengan projek perintis untuk mendapatkan kepakaran dan kemudian pergi untuk pelaksanaan sebenar. Potensi data besar sangat mengagumkan, tetapi nilai sebenar hanya dapat dicapai setelah kita mengurangkan kesilapan kita dan memperoleh lebih banyak kepakaran.Jangan gunakan data secara berasingan
Sumber data besar tersebar di sekeliling kita dan mereka semakin meningkat setiap hari. Penting untuk mengintegrasikan semua data ini untuk mendapatkan output analitik yang betul. Alat yang berbeza tersedia di pasaran untuk integrasi data, tetapi mereka harus dinilai dengan baik sebelum digunakan. Integrasi data besar adalah tugas yang kompleks kerana data dari sumber yang berbeza adalah format yang berbeza, tetapi sangat diperlukan untuk mendapatkan hasil analitik yang baik.Jangan abaikan keselamatan data
Keselamatan data merupakan pertimbangan utama dalam perancangan data besar. Pada mulanya, (sebelum melakukan apa-apa pemprosesan), data itu ada di petabytes, jadi keselamatan tidak dilaksanakan dengan tegas. Tetapi selepas beberapa pemprosesan, anda akan mendapat subset data yang memberikan sedikit pemahaman. Pada ketika ini, keselamatan data menjadi penting. Lebih banyak data diproses dan ditala dengan baik, lebih berharga yang sering menjadi organisasi. Data output halus ini adalah harta intelektual dan mesti dijamin. Keselamatan data mesti dilaksanakan sebagai sebahagian daripada kitaran hayat data yang besar.Jangan abaikan bahagian prestasi analitik data besar
Pengeluaran analitik data besar hanya bermanfaat apabila ia memberikan prestasi yang baik. Data besar menawarkan lebih banyak maklumat berdasarkan pemprosesan data yang besar pada kelajuan yang lebih cepat. Oleh itu, adalah penting untuk menguruskannya secara berkesan dan cekap. Sekiranya prestasi data besar tidak diurus dengan teliti, ia akan menyebabkan masalah dan membuat keseluruhan usaha tidak bermakna.
Dalam perbincangan kami, kami telah memberi tumpuan kepada usaha dan tidak perlu inisiatif data besar. Data besar adalah kawasan yang baru muncul dan apabila ia dilaksanakan, banyak syarikat masih dalam fasa perancangan. Adalah penting untuk memahami amalan terbaik data besar untuk meminimumkan risiko dan kesilapan. Titik perbincangan telah diperoleh daripada pengalaman projek langsung, jadi ia akan memberikan beberapa garis panduan untuk membuat strategi data yang besar berjaya.