Zašto Google Translate izbacuje jeziva religijska proročanstva?

Foto: Reddit/Google Translate

EKIPA na internetu otkrila je da Google Translate ponekad izbacuje čudne, pomalo jezive poruke koje nalikuju na neku vrstu religijskih proročanstava.

Primjerice, ako biste točno 19 puta ukucali riječ "dog" i zatražili prijevod s maorskog na engleski jezik dobili biste poruku koja glasi: "Sat sudnjeg dana je na tri minute do 12. Doživljavamo likove i dramatične događaje u svijetu koji ukazuju na to da se sve više bližimo kraju svijeta i Isusovom povratku."

Zbog te i još gomile sličnih bizarnih poruka na Google Translateu na Redditu je pokrenut kanal pod nazivom TranslateGate na kojemu ljudi dijele čudne prijevode. 

Ako biste ukucali riječ "ag" dvadesetak puta i zatražili prijevod sa somalijskog na engleski dobili biste bizarne poruke o "plemenu sinova Geršona" ili o "imenu Gospodina na hebrejskom".

Ima tu poruka i o "ubijanju u ime Islama", ali i bizarnih reklama za stranice koje nude online upoznavanje i slično. 

Neki tviteraši su tu odmah uvidjeli priliku da se pozovu na paranormalno ili potaknu rasprave o teorijama zavjere pa je portal Motherboard odlučio od stručnjaka zatražiti odgovor o čemu bi se tu moglo raditi. Uputili su upit i Googleu.

"Google Translate uči iz primjera prijevoda na webu i ne koristi 'privatne poruke' za prijevod. Sustav čak ne bi imao ni pristup takvom sadržaju", objasnio je Justin Burr, glasnogovornik Googlea, za Motherboard. "Ovo je jednostavno rezultat ubacivanja besmislica u sustav koji onda izbacuje nove besmislice", zaključio je.

Nakon Motherboardova upita, bizarne poruke su nestale pa ako sad upišete 19 puta riječ "dog" u Translate dobit ćete prijevod - 19 puta ponovljenu riječ "dog". 

Međutim, postoji ipak nekoliko mogućnosti zašto su se ovi bizarni prijevodi događali. Moguće je, naravno, da su ovakve poruke ubacivali nezadovoljni zaposlenici Googlea ili čak korisnici zloupotrebom opcije "Predloži prijevod".

Alexander Rush s Harvarda proučava prirodu obrade jezika i računalne prijevode te ipak tvrdi da bi takve manipulacije vrlo vjerojatno uočili programski filtri kvalitete. On smatra da je vjerojatnije da je do ovakvih pogrešaka doveo potez Googlea otprije nekoliko godina, kad su prešli na tehniku znanu kao "neuronski strojni prijevod". 

U takvoj vrsti prijevoda sustav uči na velikom broju tekstova na jednom jeziku te odgovarajućih prijevoda na drugom jeziku. Tako stvara model za kretanje između ta dva jezika. No kad se u sustav ubace besmislice, onda on može stvoriti bizarna rješenja i prijevode, tvrdi Rush. 

"Ti modeli su poput crnih kutija. One nastaju od onoliko primjera za učenje koliko se može pronaći. Većina njih će izgledati kao ljudski jezik. Kad dođe novi podatak one će od njega pokušati stvoriti nešto što izgleda kao ljudski jezik jer su tako naučeni, moraju proizvesti nešto što sliči ljudskom jeziku pod svaku cijenu. Međutim, kad dobiju nešto različito od onoga na što su naučeni, najbolji prijevod bit će nešto tečno, ali neće imati veze s unosom", pokušao je pojasniti on.

S njim se slaže i Sean Colbath s BBN Technologies. I on smatra da su ovi bizarni prijevodi rezultat toga što Googleovi algoritmi pokušavaju pronaći red u kaosu. On je dodao i da jezici poput somalskog, maorskog ili havajskog, koji najčešće rezultiraju tim bizarnim prijevodima, imaju mnogo manje prevedenog teksta u Googleovom sustavu, od primjerice raširenog engleskog, te da Google vjerojatno prijevod s takvih jezika onda traži u religijskim tekstovima poput Biblije jer su oni prevedeni na većinu jezika. 

Rush također kaže da bi to imalo smisla ako Google Translate uči iz tekstova poput Biblije. Googleov glasnogovornik nije otkrio je li među materijalima iz kojih Google Translate uči i Biblija. 

Pročitajte više