miércoles 22 de mayo de 2024
Lo mejor de los medios

Meta presentó una Inteligencia Artificial que traduce voz a texto casi 100 idiomas

Meta presentó SeamlessM4T, un modelo fundacional multilingüe y multitarea que traduce y transcribe a la perfección voz y texto.

SeamlessM4T será compatible con:

  • Reconocimiento automático del habla en casi 100 idiomas
  • Traducción de voz a texto en casi 100 idiomas de entrada y salida.
  • Traducción de voz a voz, compatible con casi 100 idiomas de entrada y 36 de salida.
  • Traducción de texto a texto en casi 100 idiomas
  • Traducción de texto a voz, compatible con casi 100 idiomas de entrada y 36 de salida

Disponible en código abierto junto con SeamlessAlign, un nuevo conjunto de datos de traducción, Meta afirma que SeamlessM4T representa un «avance significativo» en el campo de la conversión de voz y texto en IA.

«Nuestro modelo único proporciona traducciones que permiten a las personas que hablan diferentes idiomas comunicarse de manera más eficaz. SeamlessM4T reconoce implícitamente los idiomas de origen sin necesidad de un modelo separado de identificación de idiomas», explica la compañía de Mark Zuckerberg.

Además de la gran cantidad de servicios comerciales y modelos de código abierto ya disponibles en Amazon, Microsoft, OpenAI y varias empresas emergentes, Google está creando lo que denomina Modelo Universal del Habla, que forma parte de un esfuerzo más amplio del gigante tecnológico por construir un modelo capaz de entender los 1.000 idiomas más hablados del mundo.

Pero SeamlessM4T es uno de los esfuerzos más ambiciosos hasta la fecha para combinar las capacidades de traducción y transcripción en un único modelo. Para desarrollarlo, Meta afirma haber recopilado texto («decenas de miles de millones» de frases) y voz (4 millones de horas) de la web.

La demo de SeamlessM4T puede probarse en este enlace.

 

 

Lo último