AI

Polski najłatwiejszy dla AI? Angielski nawet nie w top 5

Zaskoczenie w świecie sztucznej inteligencji. Według najnowszego raportu opublikowanego na arXiv, język polski okazał się… najłatwiejszy do przetwarzania przez modele AI. Angielski i chiński? Nawet nie załapały się do pierwszej piątki.

Za badaniem stoją Yekyung Kim, Jenna Russell, Marzena Karpińska i Mohit Iyyer – międzynarodowy zespół naukowców, który przyjrzał się, jak duże modele językowe radzą sobie z długim kontekstem w różnych językach. I to właśnie polszczyzna, mimo najmniejszych zasobów tekstowych w sieci, zdobyła najwyższe noty.

Dlaczego akurat polski?

To pytanie zadają sobie nawet autorzy raportu. Choć modele AI były trenowane głównie na danych anglojęzycznych, to z jakiegoś powodu struktura i gramatyka polskiego okazały się dla nich… bardziej intuicyjne. Wynik? Lepsze rozumienie kontekstu i wyższa skuteczność w testach.

Angielski i chiński na wylocie

Jeszcze niedawno wydawało się oczywiste, że AI najlepiej czuje się w językach o największych zasobach danych. Tymczasem badanie pokazuje coś odwrotnego – więcej nie zawsze znaczy lepiej. Angielski i chiński wypadły zaskakująco słabo, co może zmusić twórców modeli do przemyślenia strategii trenowania systemów wielojęzycznych.

Co to znaczy dla nas?

Dla polskich użytkowników i badaczy to świetna wiadomość. Skoro AI tak dobrze radzi sobie z naszym językiem, lokalne projekty i aplikacje oparte na polszczyźnie mogą rozwijać się szybciej niż dotąd.
To także mocny argument, by inwestować w języki „mniejsze”, a nie tylko w globalny angielski mainstream.


AI może i myśli globalnie, ale najwyraźniej mówi po polsku całkiem płynnie.

źródło: national-geographic.pl

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *