Deepfakes, mentiras y vídeo
Cuando la inteligencia artificial manipula el vídeo y ya no puedes creer lo que ven tus ojos, has entrado al mundo de los deepfakes. Para qué se usan, cómo es la tecnología por detrás y qué posibilidades abren o qué delitos cometen
Dicen que si escribes tres veces la palabra deepfake en algún oscuro foro de internet, se te aparece Tom Cruise. O algún otro famoso con extrañas facciones.
Si sabes de lo que hablo, probablemente hayas visto varios de estos vídeos, cada vez más en los últimos meses, y hasta te hayas frotado los ojos con alguno. Si no lo sabes, mira esto y pregúntate si hubieses sabido que no es verdadero si no te lo dijera alguien.
“Te voy a mostrar algo de magia… Es real”, dice un Tom Cruise falso.
Lo que vemos no es real, y la tecnología de los deepfakes empieza a parecer brujería, parafraseando a Arthur C. Clarke, escritor de ciencia ficción y científico, que dijo que toda tecnología suficientemente avanzada es indistinguible de la magia.
Si nuestros sentidos pueden engañarnos, parece complicado saber cómo podemos evitar la desinformación y la confusión ante un vídeo que muestra algo que parece verdad. ¿Están los deepfakes tan avanzados? ¿Cómo funciona el proceso de tomar la imagen de una persona y construir una ficción que se mueve?
Qué son los deepfakes
Entre los muchos tipos de información falsa en las redes, el deepfake es uno de los formatos más sofisticados. Hasta ahora estábamos familiarizados con herramientas como Photoshop o los filtros de Instagram que pueden retocar o alterar imágenes, pero los avances en inteligencia artificial han llevado la manipulación de contenidos un paso más allá.
Los deepfakes son imágenes, audio o vídeo artificiales (material también llamado synthetic media, medios sintéticos, en inglés) que son manipulados o producidos en su totalidad por inteligencia artificial.
Se producen con un modelo computacional que utiliza técnicas de deep learning para producir imágenes en vídeo generadas matemáticamente. Suelen utilizar un tipo de algoritmo llamado red generativa antagónica (o GAN, generative adversarial network).
Se alimenta a un algoritmo con fotos y vídeos de la persona a la que se quiere recrear para lograr un resultado con bastante verosimilitud. La aplicación FaceApp, que se hizo viral en 2019, utiliza por ejemplo algoritmos de redes neuronales especializadas en imagen para envejecer, rejuvenecer o incluso cambiar el género de rostros reales dados.
Aunque los primeros deepfakes aparecieron hace unos cinco años, y fueron bautizados en 2017 en un foro de Reddit mezclando deep de deep learning (aprendizaje profundo) y fakes (bulos), es en 2020 cuando empezamos a ver vídeos en los que las personas recreadas son prácticamente indistinguibles de las verdaderas a simple vista.
Cualquiera puede ver que esta tecnología tendrá consecuencias en la forma en que producimos contenidos e interpretamos el mundo. Nina Schick, una autora que ha escrito ‘Deepfakes’, dice que tenemos que prepararnos para un mundo en el que cualquiera puede ser impersonado y en el que cualquiera podrá negarlo todo. Tenemos que prepararnos para un mundo en el que ver y escuchar ya no significará creer.
El primer deepfake fue pornográfico
La colaboración y el uso de código abierto que impera en la investigación sobre inteligencia artificial hace que los últimos avances y herramientas se compartan en abierto en la red. Y las aplicaciones positivas de esta tecnología animan a inversores privados a impulsar la investigación académica. Todo esto está generando una “revolución del deep learning” como lo llama Schick. Y como toda tecnología en desarrollo, esta suele utilizarse también para lo malo.
Este es el caso del origen del primer deepfake, que apareció publicado en r/deepfakes, un foro ya baneado en Reddit. Un usuario anónimo lo había creado para postear vídeos pornográficas a los que “pegaba” la cara de actrices de Hollywood.
Ya existían imágenes porno falsas con famosas, pero lo diferente, como describió Samantha Cole, la periodista de Vice que sacó a la luz este foro, es que estas creaciones “se movían, sonreían, guiñaban un ojo y follaban”.
La mismísima Scarlet Johansson fue una de las primeras víctimas de este tipo de abuso. Hay muchas más. El deepfake se usa hoy principalmente para hacer vídeos pornográficos no consentidos, como determinó un estudio de 2019 de Deeptrace Labs [PDF].
Esta compañía holandesa dedicada a la ciberseguridad analizó los 15.000 que encontró en internet y determinó que un 96% de ellos lo eran, y que las mujeres, tanto famosas como desconocidas, son las principales afectadas.
Los efectos del “porno involuntario” -como se le llama a este tipo de deepfakes- son similares a los del porno venganza (difusión de imágenes o vídeos sexuales sin consentimiento) y estos vídeos han sido específicamente prohibido por sitios como Reddit, Facebook o Tiktok.
Helen Mort es una poeta inglesa que descubrió vídeos pornográficos falsos suyos circulando en internet y decidió visibilizarlo. “Me dí cuenta de que nunca sabré quién lo hizo, y decidí dedicarme a crear conciencia”, le dijo a Rodrigo Taramona en un directo de Twitch. Él recordó que su pareja, al enterarse del tema, lo había llamado “colonización digital”, ejercida ahora sobre el cuerpo de las mujeres.
Cuando Cole pudo hablar con el creador de aquel primer deepfake se dio cuenta de que no era un programador ni un experto sino simplemente alguien con afición por estas técnicas. Lo que antes era sólo dominio de expertos en efectos especiales y requería mucho tiempo, especialización e inversión, ahora está al alcance de cualquier usuario de TensorFlow y Keras, plataformas de código abierto para machine learning.
Accesible no significa fácil
La tecnología está disponible, pero eso no quiere decir que hacer un deepfake indetectable sea fácil para cualquiera. La creación de un deepfake lleva mucho tiempo de procesamiento de cálculo y sobre todo, de experiencia.