Rumah Audio Bagaimanakah sql pada hadoop membantu dengan analisis data yang besar?

Bagaimanakah sql pada hadoop membantu dengan analisis data yang besar?

Isi kandungan:

Anonim

SQL pada Hadoop adalah sekumpulan alat aplikasi analitik yang menggabungkan query SQL dan pemprosesan data dengan elemen kerangka data Hadoop paling terkini. Kemunculan SQL pada Hadoop adalah perkembangan penting untuk pemprosesan data besar kerana ia membolehkan kumpulan orang yang lebih luas berjaya dalam rangka kerja dengan kerangka pemprosesan data Hadoop dengan menjalankan permintaan SQL pada jumlah besar data besar yang proses Hadoop. Jelas sekali, rangka kerja Hadoop sebelum ini tidak dapat diakses oleh orang, terutama dari segi kemampuan pencariannya. Berdasarkan perkembangan itu, beberapa alat telah dalam kerja-kerja yang menjanjikan untuk meningkatkan produktiviti perusahaan ketika datang untuk memproses dan menganalisis data besar dengan kualitas dan kecepatan. Terdapat juga tidak perlu melabur dalam pembelajaran alat itu, kerana pengetahuan tradisional tentang SQL perlu dilakukan.

Definisi SQL pada Hadoop

SQL pada Hadoop adalah sekumpulan aplikasi yang membolehkan anda menjalankan pertanyaan gaya SQL pada data besar yang dihoskan oleh kerangka pemprosesan data Hadoop. Jelas, pertanyaan, pengambilan dan analisis data menjadi lebih mudah dengan penambahan SQL pada Hadoop. Oleh kerana SQL pada asalnya direka untuk pangkalan data relasi, ia perlu diubah suai mengikut model Hadoop 1 yang terdiri daripada MapReduce dan Sistem Fail yang Diagihkan Hadoop (HDFS), dan model Hadoop 2 yang tidak mempunyai MapReduce dan HDFS.

Salah satu usaha terdahulu untuk menggabungkan SQL dengan Hadoop menghasilkan penciptaan gudang data Hive dengan perisian HiveQL yang boleh menerjemahkan pertanyaan gaya SQL ke dalam PetaReduce pekerjaan. Selepas itu, beberapa aplikasi telah dibangunkan yang boleh melakukan pekerjaan yang sama. Yang terkenal di antara alat-alat yang terakhir adalah Drill, BigSQL, HAWQ, Impala, Hadapt, Penyengat, H-SQL, Mesin Splice, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark), dan Tez (Hive on Tez).

Bagaimanakah sql pada hadoop membantu dengan analisis data yang besar?