top of page
VR Goggles
  • Instagram
  • Facebook
  • Twitter
  • YouTube
  • Writer's pictureGDS Radio

Un programa de Inteligencia Artificial recrea caras a partir de audios

Te contamos todos los detalles sobre este caso fascinante聽馃憞

驴C贸mo funciona el programa?

La recreaci贸n de rostros a trav茅s de fragmentos de audio es posible gracias a la聽IA Speech2Face, un proyecto nacido en el a帽o 2019 y que es parte de un Programa de Investigaci贸n y Ciencia del MIT.

Los investigadores (Tae-Hyun On, Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman y Michael Rubinstein) dise帽aron y entrenaron una red neuronal que analiz贸 millones de videos de personas hablando, tomados de YouTube. Durante el entrenamiento聽el modelo aprendi贸 a relacionar las voces con los rostros, permitiendo finalmente, producir im谩genes con atributos f铆sicos similares a los hablantes, incluyendo la edad, g茅nero y etnicidad.

Si bien ya exist铆a tecnolog铆a capaz de estimar los dos primeros factores, el componente 茅tnico es una novedad propia de la IA Speech2Face.

Aqu铆 tienes una muestra de los incre铆bles resultados obtenidos por esta tecnolog铆a. La primera imagen de la izquierda es la original y la 煤ltima de la derecha es la reconstrucci贸n obtenida desde audio.

Una cuesti贸n de Machine Learning

El sistema se apoya en dos instancias. En la primera codifica el audio para reconocer patrones. Luego decodifica esa informaci贸n y genera im谩genes de rostros.

Y si bien el mismo ha conseguido resultados asombrosos y presenta un alto n煤mero de coincidencias, recreando rostros muy similares a los reales,聽tambi茅n ha arrojado algunas fallas聽en donde no ha coincidido la etnicidad, la edad o el g茅nero con la muestra de voz utilizada. En la siguiente imagen puedes observar algunos de estos errores:

No obstante,聽al igual que cualquier otro sistema de machine learning, esta tecnolog铆a podr铆a tener la capacidad de ir mejorando con el tiempo, ya que en cada uso, esta aumenta su biblioteca de conocimientos.

En relaci贸n a esto 煤ltimo, el proyecto ha hecho algunas aclaraciones importantes.聽Speech2Face ha pronunciado que la recreaci贸n de las caras no da rostros completos, solo recrea parecidos, con la intenci贸n proteger la privacidad de las personas. Un detalle nada menor.

Por 煤ltimo y en relaci贸n a las cuestiones 茅tnicas que supone el programa, tambi茅n ha se帽alado que聽cualquier uso pr谩ctico de esta tecnolog铆a debe probarse de forma cuidadosa para garantizar que los datos sean representativos.

Comments


Cronos

Noticias a tiempo

bottom of page