Isi kandungan:
- Definisi - Apakah maksud Pengetahuan Pengetahuan dalam Pangkalan Data (KDD)?
- Techopedia menjelaskan Pengetahuan Pengetahuan dalam Pangkalan Data (KDD)
Definisi - Apakah maksud Pengetahuan Pengetahuan dalam Pangkalan Data (KDD)?
Penemuan pengetahuan dalam pangkalan data (KDD) adalah proses untuk mengetahui pengetahuan berguna dari koleksi data. Teknik perlombongan data yang digunakan secara meluas adalah proses yang merangkumi penyediaan dan pemilihan data, pembersihan data, menggabungkan pengetahuan terlebih dahulu mengenai set data dan mentafsirkan penyelesaian yang tepat dari hasil yang diperhatikan.
Bidang utama KDD termasuk pemasaran, pengesanan penipuan, telekomunikasi dan pembuatan.
Techopedia menjelaskan Pengetahuan Pengetahuan dalam Pangkalan Data (KDD)
Secara tradisinya, penambangan data dan penemuan pengetahuan dilakukan secara manual. Apabila masa berlalu, jumlah data dalam banyak sistem berkembang menjadi lebih besar daripada saiz terabyte, dan tidak dapat dikendalikan secara manual secara manual. Lebih-lebih lagi, bagi kewujudan perniagaan yang berjaya, menemui corak asas dalam data dianggap penting. Akibatnya, beberapa alat perisian telah dibangunkan untuk menemui data tersembunyi dan membuat andaian, yang membentuk sebahagian kecerdasan buatan.
Proses KDD telah mencapai kemuncaknya dalam tempoh 10 tahun yang lalu. Ia kini mempunyai banyak pendekatan yang berbeza untuk penemuan, termasuk pembelajaran induktif, statistik Bayesian, pengoptimuman pertanyaan semantik, perolehan pengetahuan untuk sistem pakar dan teori maklumat. Matlamat utama adalah untuk mengekstrak pengetahuan peringkat tinggi dari data tahap rendah.
KDD merangkumi pelbagai aktiviti disiplin. Ini merangkumi penyimpanan dan akses data, algoritma penskalaan untuk set data yang besar dan menafsirkan hasil. Pembersihan data dan proses akses data yang termasuk dalam pergudangan data memudahkan proses KDD. Kepintaran buatan juga menyokong KDD dengan menemui undang-undang empirikal dari percobaan dan pemerhatian. Corak yang diiktiraf dalam data mesti sah pada data baru, dan mempunyai sedikit kepastian. Corak ini dianggap pengetahuan baru. Langkah-langkah yang terlibat dalam keseluruhan proses KDD ialah:
- Kenal pasti matlamat proses KDD dari perspektif pelanggan.
- Memahami domain aplikasi yang terlibat dan pengetahuan yang diperlukan
- Pilih set data sasaran atau subset sampel data yang mana penemuan akan dilakukan.
- Membersihkan dan memproses data dengan menentukan strategi untuk menangani bidang yang hilang dan mengubah data mengikut keperluan.
- Memudahkan set data dengan membuang pembolehubah yang tidak diingini. Kemudian, analisa ciri berguna yang boleh digunakan untuk mewakili data, bergantung pada matlamat atau tugas.
- Padan matlamat KDD dengan kaedah perlombongan data untuk mencadangkan corak tersembunyi.
- Pilih algoritma perlombongan data untuk menemui pola tersembunyi. Proses ini termasuk menentukan model dan parameter mana yang sesuai untuk keseluruhan proses KDD.
- Cari corak kepentingan dalam bentuk perwakilan tertentu, yang termasuk peraturan pengelasan atau pokok, regresi dan kluster.
- Terangkan pengetahuan penting dari corak yang ditambang.
- Gunakan pengetahuan itu dan masukkannya ke sistem lain untuk tindakan selanjutnya.
- Dokumenkan dan buat laporan untuk pihak yang berminat.