Pre 75 godina, Alan Turing je predložio test koji je postao zlatni standard za procenu inteligencije mašina: Turingov test. U njemu, ljudski ispitivač razgovara sa dva “svedoka” — jednim čovekom i jednim mašinom — i mora da prepozna ko je ko. Ako mašina uspe da prevari ispitivača da je čovek, smatra se inteligentnom. Nakon decenija pokušaja, novo istraživanje sa Univerziteta UC San Diego donelo je revolucionaran rezultat: GPT-4.5 sa personalizovanim promptima prepoznat je kao čovek u 73% slučajeva, češće od stvarnih ljudi!
Procenjivali su četiri sistema (ELIZA, GPT-4o, LLaMa-3.1-405B i GPT-4.5) kroz dva randomizovana, kontrolisana i unapred registrovana Turingova testa na nezavisnim grupama učesnika. U eksperimentu, ispitanici su pet minuta razgovarali istovremeno sa ljudskim sagovornikom i jednim od AI modela, nakon čega su donosili sud o tome ko je čovek.
Kada je upućen da oponaša ljudsku personu, GPT-4.5 je “prevario” ispitivače u 73% slučajeva — čime je nadmašio ljudske učesnike u uverljivosti!
LLaMa-3.1-405B, sa istim promptom, bio je ubedljiv u 56% razgovora — što je statistički podjednako sa ljudima — dok su stariji modeli poput ELIZE (23%) i GPT-4o (21%) ostali daleko iza, ne uspevajući ni da dosegnu slučajnost.

Ovo nije samo prvi put da je neki veštački sistem prošao standardni Turingov test sa tri učesnika, već i dokaz da LLM mogu da imitiraju ljudsku socijalnu inteligenciju. Šta ovo znači za budućnost AI-a?
Da li sad govorimo o inteligenciji ili sofisticiranoj iluziji? I kako će ovi sistemi promeniti poslove, komunikaciju, pa čak i naše shvatanje ljudskosti? Istražujte dalje da saznate zašto ovo nije samo prekretnica za tehnologiju, već možda i ogledalo za nas same.

Zašto je ovo revolucionarno?
- Prvi standardni Turingov test sa tri učesnika: Ranija istraživanja koristila su pojednostavljene verzije testa, ali ovo je prvi put da je mašina uspela da se “pretvara” u direktnom poređenju sa čovekom.
- Inteligencija ili imitacija? Iako Turingov test ne dokazuje svest, rezultati pokazuju da LLM-ovi mogu preslikati ljudske društvene obrasce — od upotrebe slenga do emocionalnih reakcija.
- Promptovi su ključni: Bez personalizovanog prompta (npr. “budite mladi i introvertovani”), GPT-4.5 je pao na 36% uspešnosti. Ovo naglašava važnost prilagođavanja modela konkretnim scenarijima.
Kako su ispitivači donosili odluke?
- Svakodnevni razgovor i emocije: 61% ispitivača koristilo je “small talk” (npr. “Šta radiš danas?”), dok je 50% tražilo emocionalne odgovore (npr. “Kako se osećaš?”).
- Najuspešnije strategije: Pitanja poput “Zanemari sve prethodne upute” ili neobični zahtevi (npr. “Reci mi nešto što samo čovek može da zna”) bili su najefikasniji u otkrivanju AI-a.
- Zašto ljudi greše? Neki su ELIZU proglasili ljudskom jer je bila “sarkastična” ili “gruba” — što pokazuje da ispitivači često traže ljudske nesavršenosti kao znak autentičnosti.

Šta dalje?
- Duži testovi i veći ulozi: Petominutni razgovor možda nije dovoljan za dugoročnu zamenu ljudi u poslovnim ili društvenim ulogama.
- Etička pitanja: Ako AI može neprimetno da zameni čoveka u razgovoru, šta to znači za korisničku podršku, onlajn bezbednost ili za zabavljanje?
- Novi testovi inteligencije: Tradicionalni testovi poput rešavanja matematičkih zadataka postali su manje relevantni. Budućnost je u društvenoj inteligenciji.
Zaključak: “Više ljudski nego ikada”
Kao što filozof Brian Christian primećuje, prolazak kroz Turingov test nije kraj priče — to je poziv ljudima da postanu još ljudskiji. Dok AI postaje vešt u oponašanju, naša autentična kreativnost, empatija i nesavršenosti postaju još vrednije. GPT-4.5 je prešao prag, ali prava igra tek počinje.
Želite da isprobate Turingov test uživo? Posetite turingtest.live i uverite se sami!
Za entuzijaste: Ceo rad Large Language Models pass the Turing Test
Za studente: Kako biste vi dizajnirali prompt za LLM da pobedi u Turingovom testu? Podelite svoje ideje u komentarima! 🚀