Rumah Trend Bagaimanakah persekitaran gudang data sedia ada berskala terbaik untuk memenuhi keperluan analisis data besar?

Bagaimanakah persekitaran gudang data sedia ada berskala terbaik untuk memenuhi keperluan analisis data besar?

Anonim

Q:

Bagaimanakah persekitaran gudang data sedia ada berskala terbaik untuk memenuhi keperluan analisis data besar?

A:

Projek gudang data individu perlu dinilai berdasarkan kes demi kes. Pada umumnya, dalam usaha untuk meregangkan reka bentuk gudang data sedia ada untuk mengendalikan analitik data yang lebih baik, terdapat proses teras untuk mengetahui apa yang perlu dilakukan. Profesional IT boleh memanggil ini "meningkatkan" atau "keluar."

Webinar: Big Iron, Bertemu Big Data: Membebaskan Data Mainframe dengan Hadoop & Spark

Daftar disini

Meningkatkan secara amnya melibatkan melihat mendapatkan kuasa pemprosesan yang mencukupi, mendapatkan jumlah memori yang mencukupi, dan menampung aktiviti pelayan yang lebih kuat untuk mengendalikan semua set data yang lebih besar yang akan diproses oleh perniagaan. Sebaliknya, penskalaan boleh bermakna mengumpul cluster perkakasan pelayan dan rangkaian mereka bersama-sama dengan data besar corral.

Sesetengah pakar IT telah mencadangkan bahawa kaedah yang lebih biasa dengan Apache Hadoop dan alat dan platform data besar lain yang popular adalah skala dan perkakasan cluster untuk mencapai kesan yang dikehendaki. Walau bagaimanapun, yang lain menunjukkan bahawa dengan teknologi hari ini, gudang data boleh meningkatkan penggunaan strategi perolehan yang menambah sumber kepada pelayan, seperti dengan mendapatkan lebih banyak teras pemprosesan bersama dengan jumlah RAM yang lebih besar.

Sama ada skala atau skala, gudang data memerlukan aset perkakasan fizikal tambahan untuk dapat mengendalikan beban kerja data yang lebih besar. Mereka juga memerlukan pentadbiran manusia tambahan, yang bermakna lebih banyak latihan untuk pasukan dalaman. Banyak perancangan perlu pergi ke projek untuk menentukan jenis tekanan dan tekanan apa yang akan berlaku pada sistem warisan sedia ada untuk memadankannya untuk ekosistem data besar baru. Satu isu besar ialah kesesakan storan, yang memerlukan peningkatan ke pusat penyimpanan, dan lain-lain kemunculan prestasi lain yang mungkin menggerakan sistem yang baru jika tidak mereka ditangani.

Bagaimanakah persekitaran gudang data sedia ada berskala terbaik untuk memenuhi keperluan analisis data besar?