La nouvelle IA de Meta comprend plus de 4000 langues

Vue d'artiste
(Crédit photo: Unsplash)

 

Le succès mondial du ChatGPT d’OpenAI, dont GPT-4 est la dernière version, fait bien des envieux. De nombreuses entreprises se lancent ainsi dans la course. Google pense mettre être rapidement dépassé par cette technologie. Meta a donc décidé d’agir rapidement, et a acquis un supercalculateur afin de rattraper rapidement son retard dans le domaine. L'entreprise de Mark Zuckerberg vient ainsi de communiquer certaines spécificités concernant sa nouvelle IA.

De plus, le projet Massively Multilingual Speech (MMS) de l'entreprise est en open-source. Meta ouvre ainsi le MMS afin de préserver la diversité linguistique et d'encourager les chercheurs à s'appuyer sur sa technologie. L’entreprise annonce ainsi : "Aujourd'hui, nous partageons publiquement nos modèles et notre code afin que d'autres membres de la communauté des chercheurs puissent s'appuyer sur notre travail [...] Grâce à ce travail, nous espérons apporter une petite contribution à la préservation de l'incroyable diversité linguistique du monde.” 

 Intelligence artificielle : Meta se sert de la Bible 

 

Les modèles de reconnaissance vocale et de synthèse vocale nécessitent généralement une formation sur des milliers d'heures d'audio. Meta a ainsi utilisé une méthode peu commune. En effet, l’entreprise a directement puisé dans des enregistrements audio de textes religieux traduits. 

Meta précise : "Nous nous sommes tournés vers des textes religieux, tels que la Bible, qui ont été traduits dans de nombreuses langues différentes et dont les traductions ont été largement étudiées dans le cadre de la recherche sur la traduction linguistique basée sur le texte".

En plus de permettre un gain de temps considérable, cette méthode a permis à l’IA de Meta d’assimiler facilement des milliers de langues. L’entreprise ajoute : "Ces traductions sont accompagnées d'enregistrements audio accessibles au public de personnes lisant ces textes dans différentes langues. En incorporant les enregistrements non étiquetés de la Bible et de textes similaires, les chercheurs de Meta ont augmenté le nombre de langues disponibles dans le modèle à plus de 4 000.” 

Source : engadget

Jean-Sébastien Champeau
Senior Editor

Passionné par les technologies de pointe, dont l’aérospatial et l’intelligence artificielle, je ne rate jamais une occasion de partager les dernières nouvelles avec les lecteurs de TechRadar. J’affectionne par ailleurs grandement (un peu trop, peut-être ?) les jeux-vidéos, anciens comme nouveaux.