Istorija je prepuna briljantnih, ali nepouzdanih pojedinaca, a osobina, kako izgleda, nije zaobišla ni veštačku inteligenciju. Prema istrazi koju je OpenAI sproveo i podelio s The New York Times-om, njihovi najnoviji ChatGPT AI modeli, GPT o3 i o4-mini, pokazuju znatnu sklonost halucinacijama, tj. izmišljanju činjenica.
Modeli GPT o3 i o4-mini osmišljeni su da oponašaju ljudsko rezonovanje, za razliku od starijih verzija koje su se fokusirale na tečno generisanje teksta. OpenAI je istakao da je prethodni model o1 mogao dostigne ili premašiti uspeh doktoranata u hemiji, biologiji i matematici. Ali, najnoviji rezultati izazivaju zabrinutost.
U testu koji je uključivao javne osobe GPT o3 halucinirao je u 33% slučajeva, dvostruko više nego o1. Manji model o4-mini bio je još nepouzdaniji, s 48% odgovora koji su sadržali izmišljotine. Na SimpleQA testu opšteg znanja brojevi su porasli: 51% odgovora modela o3 i 79% o4-mini bili su netačni, piše portal Tech Radar.
Pretpostavka koja se razmatra u AI zajednici jeste da što više model pokušava da rezonuje, to mu raste verovatnoća greške. Stariji, jednostavniji modeli drže se visoko samouverenih predviđanja, dok noviji analiziraju više puteva i improvizuju, što onda lako prelazi u izmišljanje činjenica.
OpenAI za Times je izjavio da uzrok povećanog broja halucinacija možda nije samo složenije rezonovanje, već i veća opširnost odgovora. Budući da modeli sve češće nagađaju, granica između teorije i fikcije time postaje zamagljena.
To je zabrinjavajuće jer se AI sve više koristi u školama, kancelarijama, bolnicama i administraciji. GPT o3, iako sposoban za složene zadatke, gubi verodostojnost kada počne da generiče netačne informacije, poput tvrdnje da je Abraham Linkoln vodio podcast. AI, koji bi trebalo da pomaže i olakša rad čoveku, ne sme biti izvor grešaka i da tako posao koji pokušava da olakša zapravo dodatno otežava.
OpenAI i konkurenti poput Google-a i Anthropica nastoje da poboljšaju tačnost. Do tada na korisnicima ostaje da budu veoma oprezni jer nijedan AI odgovor ne bi trebalo uzimati zdravo za gotovo.
Izvor: Zimo/b92.net