Friday, February 11, 2011

Data Mining

Data mining adalah proses penggalian pola dari data. Data mining menjadi alat yang semakin penting untuk mengubah data menjadi informasi. Hal ini umumnya digunakan dalam berbagai profil praktek, seperti pemasaran, pengawasan, deteksi penipuan dan penemuan ilmiah. Data mining dapat digunakan untuk menemukan pola dalam data tetapi sering dilakukan hanya pada sampel data. 
 
Proses pertambangan tidak akan efektif jika sampel bukan merupakan representasi yang baik dari tubuh yang lebih besar dari data. Data mining tidak dapat menemukan pola-pola yang mungkin ada dalam tubuh lebih besar dari data jika pola-pola yang tidak hadir dalam sampel yang “ditambang”. 
 
Ketidakmampuan untuk menemukan pola bisa menjadi penyebab untuk beberapa perselisihan antara pelanggan dan penyedia layanan. Oleh karena itu data mining tidak sangat mudah, namun mungkin berguna jika cukup representatif sampel data dikumpulkan. Penemuan pola tertentu dalam satu set data tertentu tidak berarti bahwa suatu pola ditemukan di tempat lain pada data yang lebih besar dari sampel yang diambil. Sebuah bagian penting dari proses ini adalah verifikasi dan validasi pola pada data sampel lainnya.
 
Istilah terkait data pengerukan, penangkapan ikan mengintip data dan data mengacu pada penggunaan data mining teknik untuk ukuran sampel yang (atau mungkin) terlalu kecil untuk kesimpulan statistik yang akan dibuat mengenai validitas dari setiap pola yang ditemukan (lihat juga data-mengintip bias). Data pengerukan mungkin, bagaimanapun, digunakan untuk mengembangkan hipotesis baru, yang kemudian harus divalidasi dengan set sampel cukup besar.
 
Baca selengkapnya di Visilubai

No comments: