Max Kanter, un student masterand în cibernetică la MIT și profesorul său, Kalyan Veeramachaneni, au creat Data Science Machine, un algoritm care caută modele de comportament și alege ce variabile sunt mai relevante pentru fiecare subiect uman în parte. Studiul celor doi va fi prezentat în cursul acestei săptămâni în cadrul conferinței IEEE Data Science and Advanced Analytics, la Paris, scrie Agerpres.
Programele de calculator care analizează date sunt comune, însă de obicei oamenii sunt cei care trebuie să aleagă care dintre variabile sunt relevante pentru analiză.
Acest algoritm a fost testat în competiție cu 906 echipe formate din voluntari. În trei competiții algoritmul a avut rezultate mai bune decât 615 dintre cele 906 echipe formate din voluntari. Iar dacă membrii echipelor au lucrat mai multe luni la algoritmii lor predictivi, calculatorul a avut nevoie de doar 2 până la 12 ore pentru analiza și formularea predicțiilor.
Spre exemplu, într-una dintre competiții, echipele de voluntari au trebuit să prezică dacă anumiți studenți vor renunța la un curs în următoarele 10 zile, pornind de la interacțiunile dintre aceștia și resursele disponibile la un curs online. Factorii care trebuiau avuți în vedere au fost numeroși. Echipele au monitorizat cât de târziu predau studenții seturile de probleme primite la curs sau dacă își rezervau timp pentru a citi notele de curs.
În schimb, conform studiului MIT, cei mai importanți factori au fost alții. Cu cât timp înainte de termenul limită să apucau studenții să rezolve setul de probleme și cât de mult timp au stat aceștia pe site-ul cursului. Data Science Machine s-a dovedit mai bună la acest test decât echipele de voluntari.
Celelalte două teste au fost, de asemenea, dominate de algoritmul Data Science Machine. Într-unul dintre ele participanților li s-a cerut să prevadă dacă un proiect lansat printr-o campanie de strângere de fonduri va fi considerat "interesant", iar în celălalt test participanții trebuiau să determine dacă un anumit client al unui magazin va deveni sau nu client regulat.