Meta presentó un nuevo traductor y transcriptor que emplea inteligencia artificial

La empresa desplegó un nuevo modelo de inteligencia artificial (IA) que realiza traducciones y transcripciones de casi 100 idiomas en tiempo real.

La tecnología día a día se va profundizando, y es por ello que la empresa Meta presentó un nuevo modelo de inteligencia artificial (IA) que realiza traducciones y transcripciones de casi 100 idiomas como parte de sus trabajos para el desarrollo de un traductor universal.

Este modelo, denominado SeamlessM4T, sigue un enfoque de sistema único para reducir los errores y los retrasos en los procesos de traducción. Además, aprovecha los avances hechos en otros modelos de la compañía, como No Language Left Behind, el traductor universal de voz y los modelos de voz multilingüe masivos.

El nuevo modelo multimodal y multilingüe puede reconocer el discurso en cerca de 100 idiomas y traducir de voz a texto en casi 100 idiomas de entrada y salida. Dentro de sus capacidades, también puede traducir de voz a voz en casi 100 idiomas de entrada y 36 de salida, traducir de texto a texto en cerca de 100 idiomas y traducir de texto a voz en 100 idiomas de entrada y 35 de salida.

“Construir un traductor de idiomas universal, como el ficticio Pez de Babel de (la novela) Guía del autoestopista galáctico, es un desafío porque los sistemas de voz a voz y de voz a texto existentes solo cubren una pequeña fracción de los idiomas del mundo”, aseguró Meta en su blog de IA.

“Pero creemos que el trabajo que anunciamos hoy es un importante paso adelante en este viaje”, añadieron. Junto a este modelo, Meta también facilitó el conjunto de datos de traducción multimodal abierto SeamlessAlign, que cuenta con un total de 270.000 horas de alineaciones de voz y texto.

Una característica notable que distingue a SeamlessM4T es su capacidad para identificar el code-switching, que es un fenómeno lingüístico en el que los hablantes cambian entre dos o más idiomas en una sola oración.

Esta característica es especialmente desafiante para los sistemas de inteligencia artificial, y la inclusión de esta posibilidad es un punto diferente frente a los sistemas actuales del mercado. Para demostrarlo, Meta informó que ya ha sido capaz de diferenciar entre hindú, telugu e inglés en una única oración, lo que promete una mayor exactitud en la traducción en situaciones del mundo real.

A diferencia de modelos de traducción anteriores, que dividían el proceso de traducción entre sistemas variados, SeamlessM4T realiza la tarea completa de traducción en un solo paso, lo que representa un avance en la eficiencia y precisión en el entendimiento automático y en tiempo real.

Otro elemento para destacar en el desarrollo de este modelo es su capacidad para identificar palabras tóxicas o sensibles, que según la compañía son aquellas que incitan al odio, la violencia, la profanidad o el abuso. De esta forma garantizan que la traducción no introduzca toxicidad que no estaba presente en el material original.

Noticias Relacionadas