Isi kandungan:
Takrif - Apa arti Pertambangan Data Teks?
Penambatan data teks melibatkan menyikat melalui dokumen teks atau sumber untuk mendapatkan maklumat terstruktur yang berharga. Ini memerlukan alat analisis yang canggih yang memproses teks untuk mendapatkan kata kunci tertentu atau titik data utama dari apa yang dianggap sebagai format yang relatif mentah atau tidak berstruktur.
Pertambangan data teks juga dikenali sebagai perlombongan teks atau analisis teks.
Techopedia menerangkan Perlombongan Data Teks
Dalam perlombongan data teks, sistem kejuruteraan menggunakan perkara-perkara seperti taksonomi dan analisis leksikal untuk menentukan bahagian-bahagian sesuatu dokumen teks yang berharga seperti data yang ditambang. Model statistik biasanya berguna, dan sistem juga boleh menggunakan heuristik, atau meneka algoritmik, untuk cuba menentukan bahagian mana teks yang penting. Sistem kawalan lain termasuk penandaan dan analisa kata kunci, di mana alat mencari kata nama yang sesuai khusus atau tag dan kata kunci lain untuk mengetahui apa yang sedang ditulis tentang.
Satu lagi komponen unik penambangan teks sering dipanggil analisis sentimen. Dalam analisis sentimen, yang secara umumnya jauh lebih sukar daripada analisis statistik, alat analitik cuba untuk memikirkan mood atau sentimen di belakang teks bertulis dan aspek lain dari apa yang ditujukan pada tahap yang sangat subjektif dan intuitif. Dengan kemunculan alat perisikan buatan, banyak kemajuan telah dilakukan dalam analisis sentimen, supaya penomboran data teks moden lebih daripada sekadar mengumpulkan rujukan kuantitatif dan melibatkan model-model konseptual peringkat tinggi untuk melukis teks untuk mencari cara baru dan unik untuk mengagregat data berharga.
