Todas las Noticias en Películas, Avances de Películas y Reseñas.

Voicebox debería convertirse en competidor de ChatGPT en audio

Meta sugirió Voicebox. El modelo de IA generativa está entrenado para convertir texto en mensajes hablados.

meta describe Voicebox como “un modelo de coincidencia de flujo no autorregresivo entrenado para generar diálogos hablados a partir de texto”. De este modo, la inteligencia artificial podrá responder con palabras habladas, una vez que haya adquirido suficiente contexto de audio. En otras palabras, debería poder convertirse en un competidor de ChatGPT que no responda con texto, sino con audio.

Para ello, Meta dice que ya ha entrenado el modelo durante más de 50.000 horas con llamadas de audio. El gigante de las redes sociales utilizó transcripciones de audiolibros en diferentes idiomas: inglés, francés, español, alemán, polaco y portugués.

Inicialmente, el modelo de IA aprendió a predecir mensajes hablados observando lo que estaba escrito antes y después. Con el tiempo, con un conjunto de datos lo suficientemente grande, Voicebox debería poder generar audio hablado que se asemeje a una conversación real en cualquiera de los idiomas enumerados.

Voicebox abre perspectivas

Con el tiempo, Voicebox debería llegar a ser tan inteligente que pueda detectar y corregir palabras que se pronuncian incorrectamente. También se pueden eliminar el ruido de fondo y el audio irrelevante, afirma Meta. El gigante de las redes sociales mantiene el código escrupulosamente en secreto, porque parece que una divulgación pública demasiado temprana podría dar lugar a abusos.

Recomendado:  Así se ven los recibos en la aplicación Albert Heijn