Q:
Adakah data besar penyelesaian satu-saiz-semua?
A:Di dalam idea tentang ekosistem data atau industri besar keseluruhan, penggunaan strategi data besar adalah khusus untuk keperluan perniagaan atau organisasi tertentu. Salah satu kesalahan terbesar yang dilakukan oleh para eksekutif dan ahli profesional lain ialah mengambil pendekatan generik terhadap data besar, dan cuba menyesuaikan sistem ke dalam template yang telah digunakan sebelum ini.
Falsafah data besar mempunyai kaitan dengan penggunaan yang sangat disasarkan dan penggunaan micromanaged kolam besar maklumat. Sebagai contoh, syarikat yang mempunyai beribu-ribu pelanggan akan menjalankan projek data besar untuk memanfaatkan semua maklumat yang ada mengenai pelanggan tersebut - nama mereka, tempat tinggal mereka, apa yang telah mereka beli sebelumnya, dll. Walau bagaimanapun, hasilnya lebih banyak kaitan dengan menubuhkan struktur khusus untuk manipulasi data dan pelaporan daripada yang mereka lakukan dengan hanya mengumpul dan "menjalankan" set data besar-besaran ini.
Sebahagian daripada cabaran data besar ialah ia memerlukan lebih banyak proses perkakasan khusus. Syarikat sering menggunakan sistem sumber terbuka seperti Apache Hadoop, dan alat berkaitan tertentu seperti MapReduce untuk mendapatkan penyelesaian data besar dalam permainan. Ini memerlukan pengetahuan teknikal tambahan di luar hanya menyediakan jadual Microsoft Access atau mengejar beberapa teknologi pangkalan data yang lebih mudah.
Untuk membuat data besar berkesan, syarikat perlu melihat pelaksanaan dan bagaimana untuk mengelakkan mengganggu aktiviti perniagaan biasa mereka. Untuk menjadikannya paling cekap, mereka perlu melihat dengan tepat set data yang akan menjadi yang paling berguna kepada mereka. Sebagai contoh, jika jurujual atau orang lain boleh melakukan apa yang perlu dilakukan dengan laporan ringkas mengenai nama-nama terakhir, negeri-negeri dan nombor telefon, tidak masuk akal untuk cuba menjalankan lebih banyak data melalui sistem dan cuba mengumpulkan dan menyampaikan pengenal lain atau kepingan maklumat penting.
Keberkesanan, pelaksanaan mudah dan kos memacu kemunculan penyelesaian data besar khusus syarikat. Inovasi ini pasti bergantung kepada model perniagaan tertentu, dan mengenai masalah yang perlu diselesaikan.