Si un sistema de Inteligencia Artificial adecuado escucha durante el suficiente tiempo a una persona, podrá imitar su voz para decir cualquier cosa, y en lyrebird lo demuestran.
Se trata de una plataforma que ofrecerá una API (interfaz de programación de aplicaciones) para que otros sistemas puedan acceder a su inteligencia. La idea es que puedan recibir 1 minuto de voz de cualquier persona para que Lyrebird aprenda a hablar como ella, de forma que después solo será necesario escribir el texto deseado y dejar que se genere el audio con la voz “falsa”.
Como afirman en Whatsnew, ese minuto de grabación de audio será suficiente para calcular una clave única que define la voz. La API será lo suficientemente robusta como para aprender de las grabaciones ruidosas, y en su web tienen varios ejemplos de lo que ya han conseguido hacer (como políticos famosos, Donald Trump, Barack Obama y Hillary Clinton, hablando sobre el proyecto, por ejemplo).
El objetivo es revolucionar el mundo de los asistentes personales y la creación de audiobooks con voces famosas, aunque también puede usarse para la síntesis de voz para personas con discapacidad o para estudios de videojuegos.
Lyrebird se basa en modelos de aprendizaje profundo desarrollados en el laboratorio MILA de la Universidad de Montreal, donde sus tres fundadores son actualmente estudiantes de doctorado: Alexandre de Brébisson, José Sotelo y Kundan Kumar.
Veremos cómo continúa su evolución.