Isi kandungan:
Definisi - Apakah maksudnya Perlombongan Data?
Perlombongan data adalah proses menganalisis corak data tersembunyi berdasarkan perspektif yang berbeza untuk mengkategorikan maklumat berguna, yang dikumpulkan dan dipasang di kawasan umum, seperti gudang data, untuk analisis yang cekap, algoritma perlombongan data, memudahkan pengambilan keputusan perniagaan dan maklumat lain keperluan untuk akhirnya mengurangkan kos dan meningkatkan pendapatan.
Perlombongan data juga dikenali sebagai penemuan data dan penemuan pengetahuan.
Techopedia menerangkan Perlombongan Data
Langkah-langkah utama yang terlibat dalam proses perlombongan data adalah:
- Ekstrak, ubah dan muatkan data ke dalam gudang data
- Simpan dan uruskan data dalam pangkalan data multidimensional
- Sediakan akses data kepada penganalisis perniagaan menggunakan perisian aplikasi
- Data dianalisis semasa dalam bentuk mudah difahami, seperti graf
Langkah pertama dalam perlombongan data adalah mengumpulkan data yang relevan untuk perniagaan. Data syarikat sama ada transactional, tidak beroperasi atau metadata. Data transaksional berkaitan dengan operasi sehari-hari seperti jualan, inventori dan kos dll. Data tidak beroperasi biasanya dijangka, sementara metadata berkenaan dengan reka bentuk pangkalan data logik. Corak dan hubungan di antara elemen data memberikan maklumat yang relevan, yang boleh meningkatkan pendapatan organisasi. Organisasi dengan tumpuan pengguna yang kuat berurusan dengan teknik perlombongan data yang memberikan gambaran jelas mengenai produk yang dijual, harga, persaingan dan demografi pelanggan.
Sebagai contoh, raksasa runcit Wal-Mart menghantar semua maklumat yang berkaitan kepada gudang data dengan terabyte data. Data ini boleh diakses dengan mudah oleh pembekal yang membolehkan mereka mengenal pasti corak pembelian pelanggan. Mereka boleh menghasilkan corak pada tabiat membeli-belah, hari-hari yang paling berbelanja, yang paling dicari produk dan data lain yang menggunakan teknik perlombongan data.
Langkah kedua dalam perlombongan data adalah memilih algoritma yang sesuai - mekanisme yang menghasilkan model perlombongan data. Kerja umum algoritma melibatkan mengenal pasti trend dalam kumpulan data dan menggunakan keluaran untuk definisi parameter. Algoritma yang paling popular yang digunakan untuk perlombongan data adalah algoritma klasifikasi dan algoritma regresi, yang digunakan untuk mengenal pasti hubungan antara elemen data. Pembekal pangkalan data utama seperti Oracle dan SQL menggabungkan algoritma perlombongan data, seperti clustering and regrression tress, untuk memenuhi permintaan untuk perlombongan data.