Isi kandungan:
Definisi - Apakah maksudnya Data Preprocessing?
Preprocessing data adalah teknik perlombongan data yang melibatkan mengubah data mentah ke format yang mudah difahami. Data dunia sebenar sering tidak lengkap, tidak konsisten, dan / atau kurang dalam tingkah laku atau trend tertentu, dan mungkin mengandungi banyak kesilapan. Proses preprocessing adalah kaedah terbukti menyelesaikan masalah tersebut. Pra-proses data menyediakan data mentah untuk pemprosesan selanjutnya.
Proses preprocessing data digunakan aplikasi berasaskan pangkalan data seperti pengurusan hubungan pelanggan dan aplikasi berasaskan peraturan (seperti rangkaian saraf).
Techopedia menerangkan Data Preprocessing
Data berjalan melalui satu siri langkah semasa proses pra:
- Pembersihan Data: Data dibersihkan melalui proses seperti mengisi nilai yang hilang, memperlancar data bising, atau menyelesaikan ketidakkonsistenan dalam data.
- Integrasi Data: Data dengan perwakilan yang berbeza disusun dan konflik dalam data diselesaikan.
- Transformasi Data: Data dinormalisasi, agregat dan umum.
- Pengurangan Data: Langkah ini bertujuan untuk menyampaikan perwakilan dikurangkan data dalam gudang data.
- Discretization Data: Melibatkan pengurangan beberapa nilai dari atribut berterusan dengan membahagikan julat atribut atribut.