Isi kandungan:
Definisi - Apakah maksud pengekstrakan?
Pengekstrakan adalah proses mendapatkan maklumat yang relevan dari sumber data dalam corak tertentu untuk digunakan dalam persekitaran pergudangan data. Pengekstrakan menambah makna kepada data dan merupakan langkah pertama dalam proses transformasi data. Pengekstrakan memilih hanya data tertentu yang sesuai dengan keadaan atau kategori dari koleksi data yang besar yang datang dari pelbagai sumber.
Techopedia menerangkan Pengekstrakan
Dalam persekitaran pergudangan data, koleksi data yang datang dari pelbagai struktur dan sumber tidak berstruktur mesti diproses, diubah dan disimpan untuk mendapatkan kesimpulan dan ramalan yang bermakna. Data yang datang dari sumber utama mesti diimport ke dalam sistem pergudangan data dengan cara yang sistematik yang menjadikannya mudah untuk melakukan pelbagai operasi pada data. Proses ini dipanggil pengekstrakan. Pengekstrakan menambah struktur kepada data yang tidak berstruktur dengan mematuhi peraturan tertentu. Berikut adalah beberapa teknik yang digunakan dalam pengekstrakan data:
- Padanan corak
- Pendekatan berasaskan jadual
- Analisis teks