Acasă Baze de date Utilizarea algoritmilor pentru a prezice alegerile: o discuție cu desenat linzer

Utilizarea algoritmilor pentru a prezice alegerile: o discuție cu desenat linzer

Anonim

Drew va fi prezent la Big Data Innovation Summit, din 30 și 31 ianuarie la Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, alături de vorbitori de la Obama pentru America, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs și multe altele.


Link de înregistrare: http://bit.ly/Zs3wms


Acest interviu a fost realizat de George Hill și publicat în revista Big Data Innovation.


Ce fel de reacție a existat la predicțiile tale?


Cea mai mare parte a reacției s-a concentrat pe diferența de precizie între cei care au studiat sondajele de opinie publică și predicțiile „sentimentului intestinal” ale punditurilor și comentatorilor populari. În ziua alegerilor, analiștii de date ca mine, Nate Silver (New York Times FiveThirtyEight blog), Simon Jackman (Stanford University și Huffington Post) și Sam Wang (Princeton Election Consortium) au plasat toate șansele de reelecție ale lui Obama la peste 90% și au prevăzut corect 332 voturi electorale pentru Obama ca rezultat cel mai probabil. Între timp, pundits precum Karl Rove, George Will și Steve Forbes au spus că Romney va câștiga - și în unele cazuri, ușor. Acest lucru a dus la discuția despre o „victorie pentru concursuri” pe care sper că o va duce la viitoarele alegeri.


Cum evaluați algoritmul folosit în predicțiile dvs.?


Modelul meu de prognoză a estimat rezultatele votului de stat și votul electoral final, în fiecare zi a campaniei, începând din iunie. Am vrut ca evaluarea acestor prognoze să fie cât se poate de corectă și obiectivă - și să nu-mi lase nicio cameră de wiggle dacă greșesc. Așadar, cu aproximativ o lună înainte de alegeri, am postat pe site-ul meu web un set de opt criterii de evaluare pe care le-aș folosi odată ce rezultatele ar fi cunoscute. După cum s-a dovedit, modelul a funcționat perfect. În vara a prezis că Obama va câștiga toate statele sale din 2008, în afară de Indiana și Carolina de Nord, și abia a pornit de la acea previziune chiar și după sprijinul acordat de Obama în sus în septembrie, apoi a scufundat după prima dezbatere prezidențială.


Cantitatea de date utilizate pe parcursul acestei campanii atât de către analiști independenți, cât și de echipe de campanie a fost uriașă, ce implicații are aceasta pentru utilizarea datelor în 2016?


Campania din 2012 a demonstrat că mai multe surse diverse de informații cantitative pot fi gestionate, încredute și aplicate cu succes pentru o varietate de scopuri. Noi din afară am putut prezice cu mult timp înainte rezultatul alegerilor. În cadrul campaniilor, au fost înregistrate progrese enorme în direcționarea alegătorilor, urmărirea opiniei, strângerea de fonduri și participarea la alegători. Acum că știm că aceste metode pot funcționa, cred că nu se va întoarce. Mă aștept ca reporterii și comentatorii de campanie să ia mult mai în serios agregarea sondajului și în 2016, deși Obama și democrații par să dețină un avantaj în tehnologia campaniei, aș fi surprins dacă republicanii nu vor fi repede la pas.


Credeți că succesul acestei campanii bazate pe date a însemnat că managerii de campanii trebuie să fie acum analisti, precum și strategi?


Este posibil ca managerii campaniei să nu fie nevoie să fie ei înșiși analiști, dar ar trebui să aibă o apreciere mai mare pentru modul în care datele și tehnologia pot fi valorificate în avantajul lor. Campaniile au folosit întotdeauna cercetarea sondajelor pentru a formula strategie și a măsura sentimentul alegătorilor. În prezent, există o serie de alte instrumente puternice disponibile: site-uri de rețea socială, baze de date pentru alegători, smartphone-uri mobile și marketing prin e-mail, pentru a numi doar câteva. Și asta se adaugă progreselor recente în metodologiile de votare și modelarea statistică a opiniei. În politica de campanii americane se întâmplă o mulțime de inovații în acest moment.


Ai reușit să prezici rezultatele alegerilor cu 6 luni înainte, care crezi că este perioada maximă realistă pentru a prezice cu exactitate un rezultat folosind tehnicile tale de analiză?


Aproximativ patru sau cinci luni este cam atât de îndepărtat cât ne permite știința să mergem chiar acum; și asta chiar o împinge puțin. Înainte de aceasta, sondajele nu au fost suficient de informative cu privire la rezultatul final: prea multe persoane sunt indecise sau nu au început să acorde atenție campaniei. Factorii economici și politici istorici care s-au dovedit a fi corelați cu rezultatele alegerilor încep, de asemenea, să-și piardă puterea predictivă odată ce depășim intervalul de aproximativ 4-5 luni. Din fericire, asta oferă în continuare campaniilor mult timp pentru a planifica strategia și a lua decizii cu privire la modul de alocare a resurselor lor.

Utilizarea algoritmilor pentru a prezice alegerile: o discuție cu desenat linzer