Isi kandungan:
Definisi - Apa maksud Apache Nutch?
Apache Nutch adalah produk perisian crawler web yang boleh digunakan untuk mengagregat data dari web. Ia digunakan bersempena dengan alat Apache lain, seperti Hadoop, untuk analisis data.
Techopedia menerangkan Apache Nutch
Apache Nutch adalah produk sumber terbuka yang dilesenkan oleh Yayasan Perisian Apache. Masyarakat pemaju ini memegang lesen untuk pelbagai alat perisian Apache yang boleh menyusun dan menganalisis data. Salah satu teknologi utama ialah Apache Hadoop, alat analitik data besar yang sangat popular di kalangan komuniti perniagaan.
Bersama alat seperti Apache Hadoop dan ciri-ciri untuk menyimpan fail, analisis dan banyak lagi, peranan Nutch adalah untuk mengumpulkan dan menyimpan data dari web melalui penggunaan algoritma web merangkak.
Pengguna boleh mengambil kesempatan daripada perintah mudah di Apache Nutch untuk mengumpulkan maklumat di bawah URL. Pengguna biasanya menggunakan Apache Nutch bersama dengan alat sumber terbuka lain, sebuah rangka kerja yang disebut Apache Solr, yang boleh bertindak sebagai repositori untuk data yang dikumpulkan dengan Apache Nutch.
