A ‘Shocking’ Amount of the Web Is Already AI-Translated Trash, Scientists Determine

Sat, 17 Feb 2024 19:35:34 +1100

Andrew Pam <xanni [at] glasswings.com.au>

Andrew Pam
<https://www.vice.com/en/article/y3w4gw/a-shocking-amount-of-the-web-is-already-ai-translated-trash-scientists-determine>

"A “shocking” amount of the internet is machine-translated garbage,
particularly in languages spoken in Africa and the Global South, a new study
has found.

Researchers at the Amazon Web Services AI lab found that over half of the
sentences on the web have been translated into two or more languages, often
with increasingly worse quality due to poor machine translation (MT), which
they said raised “serious concerns” about the training of large language
models.

“We actually got interested in this topic because several colleagues who work
in MT and are native speakers of low resource languages noted that much of the
internet in their native language appeared to be MT generated,” Mehak Dhaliwal,
a former applied science intern at AWS and current PhD student at the
University of California, Santa Barbara, told Motherboard. “So the insight
really came from the low-resource language speakers, and we did the study to
understand the issue better and see how widespread it was.”

“With that said, everyone should be cognizant that content they view on the web
may have been generated by a machine,” Dhaliwal added."

Via Muse, who wrote "You know what? I don’t mind being proven wrong on some
things. I hate it when I am right about things that are going horribly wrong.
AI is making the internet unusable."

Cheers,
       *** Xanni ***
--
mailto:xanni@xanadu.net               Andrew Pam
http://xanadu.com.au/                 Chief Scientist, Xanadu
https://glasswings.com.au/            Partner, Glass Wings
https://sericyb.com.au/               Manager, Serious Cybernetics

Comment via email

Home E-Mail Sponsors Index Search About Us