Rumah Pangkalan data Menggunakan algoritma untuk meramalkan pemilihan: berbual dengan penarik liner

Menggunakan algoritma untuk meramalkan pemilihan: berbual dengan penarik liner

Anonim

Drew akan menyampaikan pada Sidang Kemuncak Inovasi Data Big, 30 & 31 Januari di Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, bersama pembicara dari Obama untuk Amerika, Beli Terbaik, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Labs Walmart dan banyak lagi.


Pautan Pendaftaran: http://bit.ly/Zs3wms


Wawancara ini dijalankan oleh George Hill dan diterbitkan dalam Majalah Inovasi Big Data.


Apakah tindak balas apa yang ada pada ramalan anda?


Kebanyakan tindak balas menumpukan perhatian kepada perbezaan ketepatan antara kita yang mengkaji tinjauan pendapat orang ramai, dan ramalan "usus" mengenai pakar dan pengulas yang terkenal. Pada Hari Pemilihan, penganalisis data seperti saya, Nate Silver (blog New York Times FiveThirtyEight), Simon Jackman (Stanford University dan Huffington Post), dan Sam Wang (Princeton Election Consortium) semuanya meletakkan peluang pemilihan Obama lebih 90% 332 undi pengundi untuk Obama sebagai hasil yang paling mungkin. Sementara itu, pakar-pakar seperti Karl Rove, George Will, dan Steve Forbes berkata Romney akan menang - dan dalam beberapa kes, dengan mudah. Ini telah membawa kepada perbincangan mengenai "kemenangan untuk quants" yang saya harap akan dapat dilaksanakan pada pilihan raya akan datang.


Bagaimanakah anda menilai algoritma yang digunakan dalam ramalan anda?


Model ramalan saya menganggarkan hasil undi negeri dan undi pemilihan terakhir, pada setiap hari kempen, bermula pada bulan Jun. Saya mahukan penilaian ramalan ini untuk menjadi adil dan objektif yang mungkin - dan jangan biarkan saya bilik goyang jika mereka salah. Jadi, kira-kira sebulan sebelum pilihan raya, saya menyiarkan laman web saya satu set lapan kriteria penilaian yang akan saya gunakan sebaik sahaja hasilnya diketahui. Seperti yang ternyata, model itu berfungsi dengan sempurna. Ia meramalkan sepanjang musim panas bahawa Obama akan memenangi semua negeri 2008nya dikurangkan daripada Indiana dan North Carolina, dan hampir tidak terlepas daripada ramalan itu walaupun selepas sokongan untuk Obama meningkat ke atas pada bulan September, kemudian menurun selepas perdebatan presiden pertama.


Jumlah data yang digunakan sepanjang kempen ini oleh penganalisis bebas dan pasukan kempen telah menjadi besar, implikasi apa jenis ini untuk penggunaan data pada tahun 2016?


Kempen 2012 membuktikan bahawa banyak, pelbagai sumber maklumat kuantitatif boleh diurus, dipercayai, dan diterapkan dengan jayanya ke pelbagai hujung. Kami orang luar dapat meramalkan hasil pilihan raya jauh lebih awal. Di dalam kempen, terdapat langkah besar yang dibuat dalam penargetan pemilih, penjejakan pendapat, pengumpulan dana, dan pemilih pengundi. Sekarang kita tahu kaedah ini boleh berfungsi, saya fikir tidak akan berlaku lagi. Saya mengharapkan para pemberita dan pengulas kempen mengambil agregasi pengukuran lebih serius pada 2016. Dan walaupun Obama dan Demokrat kini nampaknya mempunyai kelebihan dalam teknologi kempen, saya akan terkejut jika Republikan tidak cepat mengejar.


Adakah anda berfikir bahawa kejayaan kempen didorong data ini bermakna bahawa pengurus kempen sekarang perlu menjadi seorang penganalisis dan strategi?


Pengurus kempen mungkin tidak perlu menjadi penganalisis sendiri, tetapi mereka harus mempunyai penghargaan yang lebih besar untuk bagaimana data dan teknologi dapat memanfaatkan kelebihan mereka. Kempen sentiasa menggunakan penyelidikan tinjauan untuk merumuskan strategi dan mengukur sentimen pengundi. Tetapi kini terdapat pelbagai alat berkuasa lain yang tersedia: laman web rangkaian sosial, pangkalan data pengundi, telefon pintar mudah alih, dan pemasaran e-mel, untuk menamakan beberapa. Dan itu adalah tambahan kepada kemajuan terkini dalam metodologi pengundian dan pemodelan pendapat statistik. Terdapat banyak inovasi yang berlaku dalam politik kempen Amerika sekarang.


Anda berjaya memprediksi keputusan pilihan raya 6 bulan sebelum ini, apa yang anda fikirkan jangka masa maksimum yang realistik untuk tepat meramalkan keputusan menggunakan teknik analisis anda?


Sekitar empat atau lima bulan adalah kira-kira setakat saintifik membolehkan kita pergi sekarang; dan itu juga mendorongnya sedikit. Sebelum ini, pemilihan hanya tidak cukup bermaklumat mengenai hasil akhirnya: terlalu banyak orang sama ada yang belum membuat keputusan atau tidak mula memperhatikan kempen. Faktor-faktor ekonomi dan politik sejarah yang telah terbukti berkait dengan hasil pilihan raya juga mula kehilangan kuasa ramalan mereka apabila kita melepasi julat 4-5 bulan. Nasib baik, itu masih memberikan kempen banyak masa untuk merancang strategi dan membuat keputusan mengenai cara memperuntukkan sumber mereka.

Menggunakan algoritma untuk meramalkan pemilihan: berbual dengan penarik liner