La BBC publicó esta semana un vídeo en el que su presentador de noticias Matthew Amroliwala aparecía en pantalla hablando en perfecto español, chino mandarín e hundi. Lo curioso del caso es que Amroliwala tan sólo habla inglés, de modo que, ¿qué era lo que estábamos viendo exactamente?
Pues nada menos que un deep fake, la polémica tecnología que empezó a cosechar fama cuando salieron los primeros vídeos pornográficos aparentemente protagonizados por famosas -cuyos rasgos se superponían a los de las actrices originales gracias al uso de inteligencia artificial- y que ahora preocupa sobre todo por su capacidad de erosionar la democracia minando la confianza en los medios de comunicación.
Pero esos mismos medios están descubriendo también usos más benignos y favorables de esta tecnología: la posibilidad de realizar un doblaje optimizado, en el que ni el ojo más experto pueda detectar ningún error en la sincronización entre sonido y labios… porque los labios se adaptarán para ajustarse a la pronunciación.
Esto permitirá que cualquier rostro famoso (desde un actor de Hollywood a cualquier presentador de televisión) puede “hablar” en varios idiomas de forma totalmente transparente para los espectadores.
Cuando el objetivo era acabar con barreras idiomáticas y terminamos me pudiendo confiar en lo que ven nuestros ojos
La BBC recurrió para este experimento a la tecnología de la compañía británica Synthesia, gracias a la cual tan sólo necesitaron grabar un vídeo que registrase todos los movimientos faciales del presentador a doblar, otro leyendo el texto a traducir, y otro más, protagonizado por un doblador, por cada lenguaje al que se quisiera traducir el texto en cuestión.
Una vez recopilado este material, los técnicos de Synthesia entrenaron una red generativa hasta que la enseñaron a producir imágenes fotorrealistas de la cara de Amroliwala, que permitirían dar forma a los ‘deep fakes’ de doblaje.
“Finalmente, para dar vida a la cara digital, tanto la expresión facial como la pista de audio de nuestros colegas del World Service se transfieren a la nueva cara digital, un proceso denominado digital puppeteering“, según explica Ahmed Razek, ingeniero de la BBC.
Según la web de Synthesia, su propósito a la hora de desarrollar esta tecnología de doblaje es el de crear un mundo “sin barreras idiomáticas”, en el que cualquier persona pueda disfrutar de cualquier contenido de vídeo con independencia de su idioma.
Pero Razek llama la atención no ya sobre las posibles falsificaciones más o menos solventes que algún individuo pueda publicar por Internet, sino sobre el poder que esto otorga a los medios de comunicación:
Piensa en esto: ahora tenemos una copia digital y flexible de la cara de Matthew. Podríamos grabar un nuevo video (tal vez en nuestra cocina) e insertar esas palabras en cualquier otra grabación de Matthew, en el estudio o en exteriores Las implicaciones [para la BBC] son serias.
We use cookies on our website to give you the most relevant experience by remembering your preferences and repeat visits. By clicking “Accept All”, you consent to the use of ALL the cookies. However, you may visit "Cookie Settings" to provide a controlled consent.
This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. These cookies ensure basic functionalities and security features of the website, anonymously.
Cookie
Duración
Descripción
cookielawinfo-checkbox-analytics
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional
11 months
The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy
11 months
The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
Functional cookies help to perform certain functionalities like sharing the content of the website on social media platforms, collect feedbacks, and other third-party features.
Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Advertisement cookies are used to provide visitors with relevant ads and marketing campaigns. These cookies track visitors across websites and collect information to provide customized ads.
La BBC publicó esta semana un vídeo en el que su presentador de noticias Matthew Amroliwala aparecía en pantalla hablando en perfecto español, chino mandarín e hundi. Lo curioso del caso es que Amroliwala tan sólo habla inglés, de modo que, ¿qué era lo que estábamos viendo exactamente?
Pues nada menos que un deep fake, la polémica tecnología que empezó a cosechar fama cuando salieron los primeros vídeos pornográficos aparentemente protagonizados por famosas -cuyos rasgos se superponían a los de las actrices originales gracias al uso de inteligencia artificial- y que ahora preocupa sobre todo por su capacidad de erosionar la democracia minando la confianza en los medios de comunicación.
Pero esos mismos medios están descubriendo también usos más benignos y favorables de esta tecnología: la posibilidad de realizar un doblaje optimizado, en el que ni el ojo más experto pueda detectar ningún error en la sincronización entre sonido y labios… porque los labios se adaptarán para ajustarse a la pronunciación.
Esto permitirá que cualquier rostro famoso (desde un actor de Hollywood a cualquier presentador de televisión) puede “hablar” en varios idiomas de forma totalmente transparente para los espectadores.
Cuando el objetivo era acabar con barreras idiomáticas y terminamos me pudiendo confiar en lo que ven nuestros ojos
La BBC recurrió para este experimento a la tecnología de la compañía británica Synthesia, gracias a la cual tan sólo necesitaron grabar un vídeo que registrase todos los movimientos faciales del presentador a doblar, otro leyendo el texto a traducir, y otro más, protagonizado por un doblador, por cada lenguaje al que se quisiera traducir el texto en cuestión.
Una vez recopilado este material, los técnicos de Synthesia entrenaron una red generativa hasta que la enseñaron a producir imágenes fotorrealistas de la cara de Amroliwala, que permitirían dar forma a los ‘deep fakes’ de doblaje.
“Finalmente, para dar vida a la cara digital, tanto la expresión facial como la pista de audio de nuestros colegas del World Service se transfieren a la nueva cara digital, un proceso denominado digital puppeteering“, según explica Ahmed Razek, ingeniero de la BBC.
Según la web de Synthesia, su propósito a la hora de desarrollar esta tecnología de doblaje es el de crear un mundo “sin barreras idiomáticas”, en el que cualquier persona pueda disfrutar de cualquier contenido de vídeo con independencia de su idioma.
Pero Razek llama la atención no ya sobre las posibles falsificaciones más o menos solventes que algún individuo pueda publicar por Internet, sino sobre el poder que esto otorga a los medios de comunicación:
Fuente
Compartir esto: