Isi kandungan:
Definisi - Apa maksud Spider?
Dalam konteks Internet, labah-labah adalah perisian khas yang dirancang untuk merangkak secara sistematik dan melayari World Wide Web biasanya untuk tujuan mengindeks laman Web agar dapat memberikan mereka sebagai hasil carian untuk pertanyaan carian pengguna. Yang paling terkenal labah-labah sedemikian adalah Googlebot, crawler utama Google, yang membantu memastikan hasil yang relevan dikembalikan untuk pertanyaan carian.
Labah-labah juga dikenali sebagai crawler Web, bot carian atau hanya bot.
Techopedia menerangkan Spider
Labah-labah adalah program yang digunakan untuk menuai maklumat dari World Wide Web. Ia merangkak melalui laman web yang mengekstrak maklumat dan mengindeksinya untuk kegunaan kemudian, biasanya untuk hasil enjin carian. Labah-labah melawat laman web dan halaman mereka melalui pelbagai pautan ke dan dari halaman, jadi halaman tanpa satu pautan akan menjadi sulit untuk diindeks dan mungkin kedudukan sangat rendah pada halaman hasil carian. Dan jika terdapat banyak pautan yang menunjuk ke halaman, ini bermakna laman itu popular dan ia akan muncul lebih tinggi pada hasil carian.
Langkah-langkah yang terlibat dalam merangkak Web:
- Labah-labah mencari tapak dan mula merangkak halamannya.
- Labah-labah mengindeks kata-kata dan kandungan laman web ini.
- Labah-labah melihat pautan yang terdapat di laman web ini.
Labah-labah atau webcrawlers hanya program dan, dengan itu, mereka mengikut peraturan sistematik yang ditetapkan oleh pengaturcara. Pemilik laman web juga boleh mendapatkan ini dengan memberitahu labah-labah yang mana bahagian laman web tersebut untuk indeks dan yang tidak sepatutnya. Ini dilakukan dengan membuat fail "robots.txt" yang mengandungi arahan untuk labah-labah mengenai bahagian mana untuk indeks dan pautan untuk diikuti dan mana yang harus diabaikan. Labah-labah yang paling penting di luar sana adalah mereka yang dimiliki oleh enjin carian utama seperti Google, Bing dan Yahoo, dan yang dimaksudkan untuk perlombongan data dan penyelidikan, tetapi ada juga labah-labah jahat yang ditulis untuk mencari dan mengumpulkan e-mel untuk pengguna menjual kepada syarikat atau untuk mencari kelemahan dalam keselamatan Web.
