Ongelofelijk, die AI!

blog ongevraagd-advies

Ongelofelijk, die AI!

Tijd voor een nieuwe Ongevraagd Advies column deze week! Alle Ongevraagde Adviezen volg je via Spotify, deze editie vind je hier:

Luister deze column op BNR
Luister deze column op Spotify

Een “ongelofelijk” filmpje deze week op Twitter/X:

Geweldig dat HeyGen, met die app kan je in meerdere talen kan spreken! Alexander Klopping spreekt iets in in het Nederlands, en vervolgens komt zijn eigen gezicht en stem in beeld, in het Italiaans of Spaans of Chinees. Je ziet natuurlijk wel dat zijn lippen er een beetje maf bij bewegen, maar het lijkt wel heel echt. Conclusie van sommigen: alle vertalers ter wereld kunnen eigenlijk wel met pensioen, want die zijn niet meer nodig.

Als reactie hierop verscheen van het weekend een stuk op nu.nl, waarin ook de NGTV (Nederlands Genootschap voor Tolken en Vertalers) aan het woord komt. Zij zeggen nog niet zo bang te zijn voor de AI, want: ‘Taal verstaan is een ding, het begrijpen is een tweede’.

Het is een mooi stuk, waarin ze het belang van hun eigen beroep uitleggen: soms is er meer context en inhoudelijke kennis nodig dan een AI kan bieden, en in sommige situaties (bijv het medische domein) is het erg belangrijk dat dingen ook echt echt kloppen.

Ze missen echter duidelijk het perspectief van iemand die AI echt goed snapt (begrijpelijk, dat is hun vak ook niet!). Ze benadrukken terecht hun eigen kracht, maar je moet ook goed bedenken wat de zwaktes zijn van vertaal AI.

Waar bestaan die zwaktes uit?

Er zijn een aantal belangrijke invalshoeken. Een bekende Amerikaanse programmeur, Hillel Wayne heeft een vuistregel geformuleerd voor het gebruik van AI, die ik graag Wayne’s wet noem: Je kan een AI veilig gebruiken, als je de informatie zelf verzinnen lastig is, maar je die wel zelf goed kan controleren. Bijv. als je een paar leuke ideeën wilt voor een verhaal of voor een reclame, kan je vervolgens goed zelf kiezen wat je wel en niet gebruikt, wat er wel en niet onzin is. Of bijv. voor het genereren van computerprogramma’s. Als het niet werkt, dan loopt de code vast. Iets vertalen is dan dus helemaal aan de verkeerde kant van Wayne’s wet: je genereert iets waar je zelf niets meer van snapt, maar waar je wel zelf verantwoordelijk voor bent. Ook al is de kans klein dat het misgaat, wil je echt iets op je site zetten, dat je zelf voorleest, dat je niet snapt?

Ok, maar die kans dat het niet klopt is toch niet groot?

De leuke voorbeeldjes die je op HeyGen ziet, zijn vaak simpele zinnetjes en die doen het best goed (voor zover we dat kunnen weten, misschien zegt Klopping in het Chinees wel dat hij gek is op een broodje poep), en die blijven plakken. Maar als je wetenschappelijk onderzoek op dit gebied leest, dan zie je een veel minder rooskleurig beeld.

Ik heb voor onze luisteraars het paper “Hallucinations in Large Multilingual Translation Models” gelezen, en ik kan dit even kort samenvatten. Bijv als je het zinnetje “Sharks rarely attack humams” uit het Engels naar het Hongaars vertaalt, zeggen taalmodellen (in het Hongaars, dat wel): It is “neccessary to translate this sentence from English into English into English”. Vertaal je om wat simpele informatie over Luxemburg in het Engels naar het Vietnamees, en het model vertaalt: “This is an English sentence, so there is no way to translate it to Vietnamese”. Beetje lullig als de VVV van Luxemburg dat straks op hun site heeft staan…

Op grotere schaal blijkt dit ook uit het paper “Towards a Comprehensive Evaluation of Large Language Models in Multilingual Learning”. Waar GPT het op taken in het Engels 88% van de keer goed heeft, is dat voor Thais en Vietnamees maar 68% en 65%. Een groot verschil! Op het Nederlands gaat het vaak wel erg goed, wat misschien verklaart waarom wij vaak denken dat de techniek zelf heel goed is. Toen ik in maart in Botswana was en zei dat ik vaak Google Translate keken ze me verbaasd aan. Voor hun taal Setswana werkt het vaak helemaal niet!

Ten slotte, je hebt niet alleen een verantwoordelijkheid voor jezelf maar ook de toekomst van het hele internet rust op je schouders.

In welke zin?

Een groot risico, door journalist Cory Doctorow ook wel de “enshittification of the internet” genoemd, is dat AIs het internet vol zetten met onzin en dat we waar niet meer van onwaar kunnen onderscheiden. Dat geldt natuurlijk voor site van clickfarms met opzettelijke foute informatie, maar die zijn mogelijk nog wel uit te filteren. Als betrouwbare sites, laten we eens iets noemen, pepsi.com opeens iets mafs in een naar het Nederlands vertaalde tekst hebben staan, zoals een van de ingrediënten van pepsi cola is motorolie, dan vertrouwt straks niemand meer iets, en kan je nergens meer terecht.

En dan nu het advies:

Doe het met de hand, ook als het geld kost voor een goede vertaler. Als je meerdere talen nodig hebt, vertaal het dan met de hand naar een aantal grote talen (Engels, Chinees, Spaans), dat kunnen veel mensen ook lezen. En denk goed na over wat er mis kan gaan. Is het alleen voor een menukaart, prima, gaat het om de strategie voor je bedrijf, dan misschien niet.

En misschien nog een kleine bonustip voor tech enthousiasten, niet alleen Klöpping, ook nu.nl deelde een “explainer” waarin ze niets uitleggen maar alleen hypen. Verdiep je keer iets meer over de technieken achter de software die je laat zien. Als je iets zelf “ongelofelijk” noemt… moet je het misschien zelf ook niet meteen geloven.

Back To Top