AI przeszła test Turinga. Jeden model z czterech skutecznie oszukał człowieka

W marcu 2025 roku badacze z Uniwersytetu Kalifornijskiego w San Diego (UCSD) opublikowali preprint badania, w którym cztery duże modele językowe (LLM) musiały przejść test Turinga. Jeden z nich został uznany za nieodróżnialny od człowieka w ponad 70% przypadków, co czyni go pierwszym modelem, który oficjalnie przeszedł ten test. GPT-4.5 lepszy od innych modeli Wyniki, […] Artykuł AI przeszła test Turinga. Jeden model z czterech skutecznie oszukał człowieka pochodzi z serwisu ANDROID.COM.PL - społeczność entuzjastów technologii.

Kwi 16, 2025 - 20:29
 0
AI przeszła test Turinga. Jeden model z czterech skutecznie oszukał człowieka
Ludzka twarz z elektronicznymi obwodami na tle mapy świata utworzonej z cyfr binarnych.

W marcu 2025 roku badacze z Uniwersytetu Kalifornijskiego w San Diego (UCSD) opublikowali preprint badania, w którym cztery duże modele językowe (LLM) musiały przejść test Turinga. Jeden z nich został uznany za nieodróżnialny od człowieka w ponad 70% przypadków, co czyni go pierwszym modelem, który oficjalnie przeszedł ten test.

GPT-4.5 lepszy od innych modeli

Wyniki, choć jeszcze nie zostały zweryfikowane w procesie peer-review, wywołały dyskusję na temat zdolności maszyn do imitowania ludzkiej inteligencji. Test Turinga, zaproponowany przez Alana Turinga w 1950 roku, sprawdza, czy maszyna może prowadzić rozmowę w sposób nieodróżnialny od człowieka.

W badaniu UCSD uczestnicy przez pięć minut rozmawiali jednocześnie z dwoma rozmówcami – człowiekiem i chatbotem – za pośrednictwem interfejsu przypominającego komunikator. Następnie oceniali, który z rozmówców był człowiekiem. Nie był to zresztą pierwszy przypadek takiego testu, o innym teście Turinga z udziałem ChatGPT pisaliśmy już wcześniej.

GPT-4.5 został uznany za człowieka w aż 73% przypadków, LLaMa-3.1-405B w 56%, GPT-4o w zaledwie 21%. Szczególnie interesujący jest zaś fakt, że ELIZA – jeden z pierwszych w historii czatbotów – uzyskał wyższe 23%.

ELIZA to program stworzony w latach 1964–1966 przez Josepha Weizenbauma, profesora MIT. Czatbot, nazwany na cześć postaci Elizy Doolittle ze sztuki „Pygmalion” George’a Bernarda Shawa, został zaprojektowany do symulowania rozmowy z człowiekiem poprzez przetwarzanie tekstu w sposób przypominający interakcję z psychoterapeutą. Warto jednak wiedzieć, że ELIZA też nie była pierwsza, a pojęcie „bot” powstało znacznie wcześniej.

Pomogło stworzenie tzw. persony

Kluczowym czynnikiem sukcesu GPT-4.5 było zastosowanie „persony” – szczegółowych instrukcji określających ton, zainteresowania i styl językowy, jaki czatbot ma wdrożyć do swojego działania.

Bez tych wskazówek model osiągał znacznie gorsze wyniki, co sugeruje, że jego zdolność do przejścia testu zależy od umiejętnego naśladowania ludzkich zachowań, a nie od rzeczywistej inteligencji. Autorzy badania, Cameron Jones i Benjamin Bergen, podkreślają, że test Turinga mierzy „zastępowalność” – czyli zdolność maszyny do udawania człowieka – a nie prawdziwą inteligencję, a tym bardziej nie jest żadną oceną świadomości maszyny, czymkolwiek by ona nie była.

Sukces inteligencji, czy tylko maszynowe aktorstwo?

Krytycy testu Turinga, w tym filozofowie tacy jak John Searle, argumentują, że zdolność do imitacji zachowania nie dowodzi myślenia. Test skupia się na zewnętrznym zachowaniu, ignorując wewnętrzne procesy myślowe, co może prowadzić do fałszywych wniosków o inteligencji maszyn. Co więcej, badanie UCSD miało ograniczenia, takie jak krótki czas rozmowy (pięć minut) oraz niejasny wpływ „person” na wyniki, co budzi wątpliwości w kwestii rzetelność eksperymentu.

Wynik GPT-4.5 wskazuje na postępy w rozwoju modeli językowych, ale nie rozstrzyga, czy maszyny zbliżają się do ludzkiej inteligencji. Test Turinga, choć ikoniczny, jest coraz częściej kwestionowany jako miara inteligencji maszyn. Badacze sugerują, że przyszłe testy powinny obejmować szerszy zakres zachowań, aby lepiej ocenić zdolności AI, co może pomóc w zrozumieniu, jak blisko maszyny są do prawdziwie ludzkiego myślenia.

Sam fakt, że mający kilkadziesiąt lat model ELIZA wyprzedził GPT-4o stanowi niejako potwierdzenie, że test Turinga mierzy jedynie to, na ile umiejętnie maszyna udaje rozmowę, a nic, bądź bardzo niewiele, mówi nam o maszynowej inteligencji. Jeżeli chcesz testować różne czatboty na swoim komputerze warto zainwestować w mocny sprzęt, wówczas AI będzie mogła być uruchomiona bez chmury, nasz ranking mocnych laptopów pomoże wybrać odpowiednie urządzenie.

Źródło: opracowanie własne, na podstawie publikacji naukowej. Zdjęcie otwierające: Gerd Altmann / Pixabay

Część odnośników to linki afiliacyjne lub linki do ofert naszych partnerów. Po kliknięciu możesz zapoznać się z ceną i dostępnością wybranego przez nas produktu – nie ponosisz żadnych kosztów, a jednocześnie wspierasz niezależność zespołu redakcyjnego.

Artykuł AI przeszła test Turinga. Jeden model z czterech skutecznie oszukał człowieka pochodzi z serwisu ANDROID.COM.PL - społeczność entuzjastów technologii.