Projekt Aya
Veliki jezični modeli izmišljaju riječi i padaju na logičkim testovima
Ogromna većina današnjih generativnih UI alata izgrađena je na velikim jezičnim modelima (LLM) obučenim na tekstovima i podacima na engleskom i kineskom jeziku. A to šest milijardi izvornih govornika više od 7000 drugih jezika dovodi u opasnost da budu izostavljeni i minorizirani u svijetu u kojem nove tehnologije ubrzano preoblikuju naša radna mjesta, načine poslovanja i obrazovanje, ali i umjetnost i još mnogo toga. ChatGPT može prilično dobro prevesti upite i odgovore na engleski, ali često ima problema s prevođenjem engleskog na druge jezike. Jezici poput francuskog i kineskog, koji su poznati kao jezici s “visokim resursima” i dobro su zastupljeni u podacima o obuci, prevode se na engleski puno bolje od javanskog i drugih jezika sa “slabim resursima”. Suočen s mnogim nedovoljno zastupljenim jezicima, ChatGPT se bori sa sintaksom, izmišlja riječi i stvara besmislice, upozorava Andrew Deck koji je testirao mogućnosti besplatne verzije chatbota objavljenog krajem prošle godine. Bug