Websites meertalig maken met Machine Translation
Dat websites beter presteren als ze in de taal van de bezoeker worden gepresenteerd lijkt een open deur. Toch is dit voor de internationaal expanderende dotcom bedrijven een enorme kluif, waar ze niet omheen kunnen. Zo’n driekwart van de consumenten zegt zijn aankoop eerder te doen in een winkel die in eigen taal communiceert.
Machines spreken binnenkort vloeiend in alle talen
Machine Translation (MT) wordt daarvoor steeds belangrijker. De markt van machinevertaling groeit tot 2019 jaarlijks met zo’n 23 procent, nog drie jaar verder en de niche vertegenwoordigt een waarde van een miljard dollar. Zeker nu ieder e-commerceplatform en tooling voor Product Information Management zich technisch makkelijk laat koppelen aan dergelijke slimme technologie, neemt de vraag toe. De oplossingen halen via een connector zelf de content uit het systeem en leveren de vertaalde output waar en wanneer dat nodig is.
Chris Bishop, wetenschapper van Microsoft Research, deed recent de voorspelling dat machines over tien jaar zo goed zijn dat die vloeiend in alle Europese talen spreken. Inclusief de juiste toon en het bijbehorende menselijk taalgebruik. Want precies dat geeft in praktijk nu nog een hoop problemen. Natuurlijk kom je al een eind door een website te koppelen aan de API van Google Translate of Bing Translate, maar de meesten weten ook dat de kwaliteit hiervan nog te wensen over laat.
Rol van de mens
Mensen blijven voorlopig nodig. Het is de eeuwige uitdaging voor veel bedrijven die hiermee experimenteren: de mens achter het taalgebruik ontbreekt, vertelt Ray Flournoy, productmanager bij marktplaats Etsy. Plaatst Etsy een ‘clutch’ of ‘cross-body bag’ dan snapt een machine doorgaans niet dat dit twee typen tassen zijn. Nee, een ‘clutch’ is volgens het toch goed ontwikkelde Google Translate een versnellingspook, laatstgenoemde logischerwijs een lijkzak. Doorgaans geen items die je tegenkomt op de site voor zelfgemaakte producten.
Maar naast zulke directe ‘vertaalfouten’ is er ook het probleem van de koude of gewoonweg verkeerde toon. Een welgemeende ‘Thanks for visiting!’ wordt nog weleens vertaald als ‘Merci pour la recherche’, waarmee de Fransen worden bedankt voor hun onderzoek of bekijken van de collectie. En dat was dan weer niet de boodschap die je als e-commercemanager voor ogen had.
De groei van e-commerce maakt het nog belangrijker dat het door Bishop geschetste beeld werkelijk wordt. Voor iedere verkoper valt daarmee de taalbarrière immers weg. De klantreis van Italiaan is daarmee exact gelijk aan die van een Nederlander. De meeste bedrijven lossen de problemen nu zelf op door de vertalingen te laten controleren door de mens, anderen kiezen er juist voor om de machines zelf te verbeteren. De mens voedt de machines met nuance en context, die leert hier vervolgens van en komt in de toekomst met een beter .
Voor die laatste optie heeft Etsy zo’n twee jaar geleden gekozen, vertelt Flournoy in een interview. Intern worden de teksten die mogelijk voor problemen gaan zorgen handmatig geselecteerd. Een medewerker vertaalt deze vervolgens op de juiste manier en voedt daarmee software van Microsoft. Met – voorzichtig – goed resultaat: Etsy heeft bijvoorbeeld niet meer dan tien keer geld hoeven teruggeven omdat de productomschrijving volgens de klant echt niet klopte.
Of de voorspelling uitkomt en werkelijk iedere e-commerce-omgeving straks op machinevertaling vertrouwt, valt nog te bezien. Wel is de ontwikkeling gebaat bij de groeiende hoeveelheid onderzoek die wordt gedaan naar ‘natural language processing’ (NLP) en machine learning. Google investeert, IBM ontwikkelt Watson, zelfs de Europese Unie pompt er geld in. Vooral onderzoek naar ‘neural networks’ moet de computervertalingen verbeteren. Zelflerende algoritmes moeten opereren als het menselijk brein en met een vertaling kunnen komen die past in de context. Ook als het algoritme die vertaling zelf nog nooit eerder heeft gezien.
bron: Emerce