viernes 3 de mayo de 2024
Lo mejor de los medios

La Inteligencia Artificial que desgraba audios de forma gratuita

Whisper es una aplicación web ideal para periodistas y estudiantes. Permite subir un archivo de audio (por ejemplo un mp3) y transcribirlo fielmente a texto, sea cual sea el idioma.

Mediante Machine Learning, Whisper ha procesado cientos de miles de audios en 96 lenguajes y ha aprendido patrones sobre cómo hablan los humanos.

«Whisper es un modelo de reconocimiento del habla de uso general. Está entrenado en un gran conjunto de datos de audio diverso y es también un modelo multitarea que puede realizar reconocimiento del habla multilingüe, así como traducción del habla e identificación del idioma», explican sus creadores.

Desgrabar un audio siempre fue una tarea tediosa para los periodistas, que puede llevar hasta 2 horas para un audio de 60 minutos. La cantidad de tiempo que puede ahorrarse con herramientas como Whisper -si funcionan bien, por supuesto- es realmente sorprendente.

Whisper sirve para cualquiera que necesite transcribir un vídeo o un podcast, o resumir y sintetizar el contenido de una entrevista o una lección. Incluso funciona hasta para extraer las letras de canciones.

Lo último