Microsoft a un projet entre les mains : permettre à Skype de traduire des conversations en temps réel. L’idée est fantastique, les possibilités sont énormes… Fini les barrières au moment de faire des vidéoconférences avec des personnes provenant d’autres pays sur Skype. Ce serait le premier pas pour créer un système efficace de traduction simultanée automatique mais cela semble de la science-fiction.
Les textes que nous publions sur les réseaux sociaux sont utilisés pour cette nouvelle plateforme de traduction afin de comprendre comment communiquent les êtres humains, utiliser le langage jour après jour et être le plus naturel possible.
Le système est une synthèse de diverses technologies en incluant la reconnaissance de la voix, la traduction automatique et la synthèse de voix, un programme que nous verrons en version beta avant la fin de l’année. Maintenant les chercheurs sont concentrés pour créer un système naturel de conversation car nous parlons de façon différente de celle dont nous écrivons. Il y a souvent des « aah, ehh, humm » etc… qui doivent être aussi reconnus. Pour cela, le système travaille aussi à l’aide de statistiques en stockant des phrases qui se disent régulièrement après d’autres, des phrases personnalisées pour certains groupes de personnes, des déductions quand arrive une question ou une exclamation après une certaine phrase dans des contextes déterminés… Les réseaux sociaux aident suffisamment les machines à apprendre à « parler » de cette manière.
Pour chaque réseau social, différents facteurs ont été pris en compte car dans Facebook apparaissent souvent des expressions plus émotionnelles. Dans le réseau SMS ce sont des messages trop courts et Twitter est un étrange mélange entre les deux. Les chercheurs ont dû développer en premier lieu un système de normalisation de textes de communication sociale, un programme qui pourrait s’adapter automatiquement à ces variations pour produire quelque chose que le programme pourrait procéder.
Les détails concernant la façon dont s’est réalisée cette étude se trouvent sur spectrum.ieee.org où le nom de cette technologie apparait : Syntatic SMT (Statistical Machine Translation).
Nous sommes donc très excités de voir le système fonctionner…