Zdumiewające odkrycie. Badania przeprowadzone przez naukowców wykazały, że język polski najlepiej sprawdza się w pracy z dużymi modelami sztucznej inteligencji, wyprzedzając nawet angielski i chiński. Badacze z University of Maryland oraz Microsoftu ogłosili zaskakujące wyniki testów dużych modeli językowych – to właśnie język polski okazał się najskuteczniejszy w pracy ze sztuczną inteligencją. Odkrycie to wywołało zdumienie samych naukowców, ponieważ polszczyzna nie należy do języków z największymi zasobami treningowymi. Do tej pory dominowały angielski i chiński, na których zazwyczaj szkoli się modele AI, lecz w tym badaniu oba te języki wypadły znacznie gorzej od polskiego. Eksperyment polegał na sprawdzeniu, jak dobrze modele językowe radzą sobie z analizą tzw. długiego kontekstu – czyli zrozumieniem bardzo obszernych tekstów i wyszukiwaniem w nich konkretnych informacji. Naukowcy oceniali także, czy systemy nie zmyślają odpowiedzi, których nie da się wyczytać z przesłanego materiału. W tej kategorii język polski uzyskał imponującą skuteczność – aż 88 procent. Angielski niżejDla porównania, angielski znalazł się dopiero na szóstym miejscu spośród 26 języków, osiągając średni wynik 83,9 proc., a chiński uplasował się niemal na końcu zestawienia z wynikiem 62,1 proc.Pierwszą dziesiątkę rankingu zdominowały języki europejskie – głównie słowiańskie, romańskie i germańskie – które wykorzystują alfabet łaciński i mają bogate zasoby treści w internecie, szczególnie w Wikipedii. Duża skutecznośćOkazało się również, że języki wysokozasobne, czyli te, w których jest więcej treści, pozwalają na większą dokładność modeli. W zależności od języka dokładność sztucznej inteligencji może się różnić nawet o ok. 20 proc. Według autorów badania może to oznaczać, że warto zwrócić większą uwagę na języki mniej popularne, takie jak polski, które mogą okazać się skuteczniejsze przy trenowaniu modeli językowych.Choć naukowcy nie wskazali jednoznacznej przyczyny sukcesu polszczyzny, sugerują, że wynika on z jej złożonej struktury gramatycznej. Wielość form fleksyjnych i precyzyjne zasady składniowe mogą ułatwiać modelom językowym rozumienie kontekstu i ograniczać ryzyko błędnych interpretacji. Dzięki temu polski może stanowić wyjątkowo skuteczne narzędzie do testowania i rozwijania sztucznej inteligencji.Czytaj też: „Niepytalski pyta”: Szef OpenAI ogłosił kolejny przewrót w dziedzinie AI