Umjetna inteligencija bolja je od ljudi u čitanju s razumijevanjem

Iz Microsofta i Alibabe danas objavljen je veliki uspjeh njihovih sustava umjetne inteligencije na standardnom Stanfordovom testu čitanja s razumijevanjem (Stanford Question Answer Dataset, SQuAD). Ovaj se test sastoji od preko 100 tisuća pitanja koja su crowdsourcingom izvučena iz preko 500 članaka s Wikipedije. Ispitanici (ljudi ili AI u ovom slučaju) čitaju navedene članke i potom odgovaraju na nestrukturirana pitanja, na koja odgovore predstavlja jedan isječak pročitanog teksta.

Navedeni AI sustavi postigli su razinu čitanja s razumijevanjem koja je otprilike na razini ljudske, odnosno malo iznad nje. Rezultat koji su ljudi na ovom testu postigli jest 82.304 boda. Microsoft je početkom siječnja prijavio da su prestigli taj cilj i svojim AI sustavom dostigli 82.650 bodova. Prvi je to puta da je netko nadmašio ljudske sposobnosti na ovom testu.

Gotovo istovremeno iz Alibabe su prijavili rezultat od 82.440 bodova. To je postigao njihov AI sustav koji se već neko vrijeme koristi u kompaniji kao "chatbot", računalni program koji ima zadatak odgovarati na pitanja korisnika.

Izvor: bug.hr