Q:
Lebih banyak tidak selalu lebih baik. Bagaimanakah organisasi dapat mengurangkan bunyi dalam data mereka untuk mencapai analisis yang tepat dan tepat?
A:Dengan sistem data yang besar, salah satu persoalan besar bagi syarikat adalah bagaimana untuk memastikan projek-projek ini menjadi sasaran dan efisien. Banyak alat dan sumber yang dibina untuk data besar dibina untuk menyedut sejumlah besar maklumat dalam jaring yang luas. Mereka tidak selalunya menjadi perhatian terhadap penapisan data itu, dan menjadikannya mudah. Walau bagaimanapun, terdapat beberapa amalan terbaik yang muncul dalam industri untuk menghasilkan projek data besar yang lebih besar dan sasaran.
Satu pilar pendekatan data besar yang disasarkan adalah menggunakan alat dan sumber perisian yang sesuai. Tidak semua analisis dan sistem data besar adalah sama. Ada yang lebih berkesan dapat menapis data yang berlebihan atau tidak relevan, dan membenarkan perniagaan hanya menumpukan pada fakta penting yang akan menentukan proses teras dan operasi mereka.
Satu lagi bahagian utama ini melibatkan orang. Sebelum melibatkan diri dalam projek data besar, dan ketika menjana perisian penjual, mengejar pelaksanaan dan melatih orang lain, satu kumpulan utama orang perlu bertanggung jawab atas proses itu, dan mewakilkan tugas penyelidikan dan brainstorming. Ini boleh membuat pendekatan data yang besar ke dalam kaedah yang tepat, pembedahan yang akan meningkatkan perniagaan tanpa menjadi terlalu berat dan mengganggu operasi sehari-hari.
Sebagai contoh, pasukan tugas atau kumpulan teras lain boleh duduk dan melihat secara terperinci mengenai cara pelaksanaannya akan dilaksanakan, bagaimana perniagaan akan mula menilai set data, bagaimana mereka akan menyeberang akaun indeks, apa jenis kertas atau persembahan digital yang mereka akan gunakan untuk menyebarkan maklumat itu, bagaimana mereka akan membina laporan yang berguna, dll. Butiran ini akan melindungi perniagaan dari kembung data besar.
Juga, apabila syarikat mula memperoleh lebih banyak perkhidmatan vendor, melakukan lebih banyak data yang besar dan menjadikan arsitektur IT lebih rumit, mereka telah belajar memisahkan data yang paling sensitif dari segala yang lain.
Satu cara untuk melakukan ini adalah untuk mencipta sistem peringkat. Contohnya, set data teras ID dan sejarah pelanggan boleh disimpan dalam pangkalan data yang dikendalikan khusus di bawah kontrak keselamatan awan tertentu, atau di lokasi. Set data lain boleh berada dalam persekitaran data yang kurang khusus, sama ada kerana mereka kurang sensitif dari segi pelanggaran data, atau kerana ia kurang relevan langsung dengan analisis yang dilakukan oleh perniagaan. Sistem bertingkat atau pelbagai peringkat membolehkan pelaksanaan data besar yang efektif.
Ini adalah beberapa cara perniagaan semakin pintar untuk mendapatkan data besar dengan cara yang betul. Daripada hanya mengosongkan sebarang data yang mereka dapat ambil, mereka memperlakukan set data tertentu sebagai yang paling penting untuk mendapatkan kecerdasan perniagaan yang paling dengan usaha paling sedikit.