Isi kandungan:
Definisi - Apakah maksud Apache Babi?
Apache Pig adalah platform yang digunakan untuk menganalisis set data yang besar. Ia terdiri daripada bahasa peringkat tinggi untuk menyatakan program analisis data, bersama-sama dengan infrastruktur untuk menilai program-program ini. Salah satu ciri yang paling penting dari Babi ialah strukturnya responsif kepada pemesejan yang signifikan.
Babi beroperasi di platform Hadoop, menulis data dan membaca data dari Sistem Fail Teragih Hadoop (HDFS) dan melakukan pemprosesan dengan menggunakan satu atau lebih pekerjaan MapReduce. Apache Babi boleh didapati sebagai sumber terbuka.
Apache Pig juga dikenali sebagai Pig Programming Language atau Hadoop Pig.
Techopedia menerangkan Apache Babi
Apache Pig mempunyai dua bahagian: Bahasa Latin Pig dan mesin Pig. Bahasa Babi Latin adalah bahasa skrip yang membolehkan pengguna untuk menggambarkan cara aliran data dari satu atau lebih masukan mesti dibaca dan diproses, dan lokasi di mana mesti disimpan.
Beberapa sifat utama Pig Latin adalah seperti berikut:
- Mudah untuk program: Tugas rumit yang terdiri daripada pelbagai transformasi data yang saling terhubung dengan jelas dikodkan sebagai urutan aliran data. Ini menjadikan mereka mudah untuk menulis, memahami dan mengekalkan.
- Kemungkinan pengoptimuman: Cara di mana tugas dikodkan membolehkan sistem mengoptimumkan pelaksanaan automatik. Ini membolehkan pengguna memberi perhatian kepada semantik dan bukannya kecekapan.
- Keluasan: Pengguna dibenarkan membuat fungsi mereka sendiri untuk menjalankan pemprosesan tujuan khas. Enjin Babi bertanggungjawab untuk melaksanakan aliran data yang ditulis dalam Babi Latin. Sama seperti reka bentuk sistem pengurusan pangkalan data relasi standard (RDBMS), Apache Pig terdiri daripada parser, pengoptimasi dan pemeriksa jenis, sebagai tambahan kepada pengendali yang menjalankan pemprosesan data. Babi tidak termasuk transaksi, katalog data atau keupayaan untuk mengendalikan penyimpanan data secara langsung atau menggunakan kerangka pelaksanaan.