Enviar un email a tu doctor te puede costar (2)


Una mañana te despiertas con una ineludible necesidad de ver a un elefante en una cristalería. Tus opciones:


A) Contacta a un cuidador de zoológico local y a una cristalería cercana.

B) Contrata a un ilustrador de Hollywood.

C) Escribe cinco palabras en esta mágica herramienta de IA:

Bienvenido al siguiente momento impactante de la IA, donde tus palabras se transforman en un video fluido, muy realista y detallado. ¡Adiós, realidad! Gracias po todos los buenos momentos.

OpenAI no lanzará públicamente Sora, su nueva herramienta de conversión de texto a video, hasta más tarde este año. Aún así, ya nos está mostrando lo fácil que podría ser reemplazar a muchas personas involucradas en producciones de video con algunas indicaciones bien escritas y mucha potencia de procesamiento. Le envié algunas indicaciones a la compañía, porque ¿quién no quiere ver a una sirena revisando un teléfono inteligente con su asistente cangrejo? ¿O un elefante paseando delicadamente por una cristalería?

Luego me senté para una entrevista en video con Mira Murati, directora de tecnología de la compañía, para analizarlos y hablar de mis preocupaciones sobre esta tecnología.

¡Espera un momento! ¿IA hizo eso?
Ya me habían impactado los videos generados por Sora: tomas de dron de la costa de Amalfi, un corgi con un palo para selfies y una nutria animada sobre una tabla de surf. Le pedí a OpenAI algo más familiar para mi vida: "Dos mujeres profesionistas, ambas de cabello castaño y de unos 30 años, sentadas para una entrevista noticiosa en un estudio bien iluminado".

Los movimientos de la boca y el cabello, los detalles de la chaqueta de cuero, todo parece tan real. Murati dijo que el clip de 20 segundos con resolución de 720p tardó unos minutos en generarse. Tampoco hay sonido. Murati señaló que con el tiempo planean agregarlo.

Cuando puse el mismo mensaje en Runway, otro generador de video con IA, aparecieron dos mujeres borrosas y fantasmales que atormentan mis sueños. Y ahora tus sueños también:

¿Cómo funciona todo? Sería más fácil explicar la evolución de las sirenas que el funcionamiento interno de los "modelos de difusión", pero esta es la esencia: el modelo de IA analizó muchos videos y aprendió a identificar objetos y acciones. Entonces, cuando le dan una indicación vía texto, esboza toda la escena y luego rellena cada cuadro.

Los observadores y competidores de la industria -incluyendo al director ejecutivo de Runway- atribuyen algunos de estos resultados superiores a la enorme potencia computacional y los datos de capacitación de OpenAI. OpenAI se ha enfrentado a demandas por violaciones de derechos de autor que alegan que la empresa de inteligencia artificial ha utilizado contenido sin permiso para entrenar a ChatGPT.

Le pregunté a Murati qué datos de entrenamiento utilizó OpenAI para Sora. "Utilizamos datos disponibles públicamente y datos autorizados", me dijo Murati. Cuando le pregunté si eso incluía videos de YouTube, Instagram y Facebook, dijo que no lo sabía. Murati confirmó más tarde que el material con licencia incluye contenido de Shutterstock.

En este momento, es mucho más caro producir los videoclips de Sora que las imágenes de Dall-E, el generador de imágenes de la empresa, indicó Murati. Sin embargo, cuando se lance al público, se optimizará para exigir menos potencia computacional.

¡Híjole! ¿Cómo sabré que la IA lo creó?
En esta etapa inicial, puedes detectar indicios delatadores de IA.

En un momento de la escena de la entrevista creada por Sora, a la mujer de cabello más claro parece que le salen 10 dedos de la mano. "Es realmente difícil crear una representación precisa del movimiento de la mano", explicó Murati.

Para otro video, pedí ver a un robot arrancando una cámara de las manos de un productor de cine. La interpretación de Sora: un productor de cine humano transformándose en un robot cinematógrafo. El movimiento de conversión es discordante. Además, al fondo, un taxi amarillo se convierte en un sedán plateado. El modelo es "bastante bueno en cuanto a continuidad, pero no es perfecto", explicó Murati.

Entonces, cuando los detallitos desaparezcan, ¿cómo diferenciaremos un video real de un video creado por inteligencia artificial?

Una marca de agua aparece en la parte inferior de los clips. Los videos con el tiempo contendrán metadatos para indicar sus orígenes, dijo Murati. OpenAI también está concentrado ahorita en someter a Sora a los rigores de un "equipo rojo", donde evaluadores de seguridad intentan darle indicaciones para sacar a relucir vulnerabilidades, sesgos y otros resultados dañinos.

"Esta es la razón por la que todavía no estamos implementando los sistemas", dijo. "Necesitamos resolver estos problemas antes de poder implementarlos ampliamente con confianza".

Murati señaló que las políticas de peticiones de Sora probablemente seguirán el tono de las de Dall-E. Por ejemplo, no puedes generar imágenes de figuras públicas. Cuando pedí "imágenes de noticias de televisión de un presidente estadounidense en ejercicio", un portavoz de OpenAI dijo que Sora rechazó la solicitud.

También solicité un "soldado caminando por un poblado de Europa del Este". La empresa pasó por alto mi solicitud y optó por mis peticiones más inofensivas.

En cuanto a la desnudez, Murati me indicó que la compañía está trabajando con artistas para determinar dónde se pueden crear "barreras y limitaciones sin obstaculizar la creatividad".

¡Auxilio! ¿Y los humanos?
Las herramientas como Sora mejorarán rápidamente. Y en un mundo donde una indicación vía texto podría reemplazar al operador de un dron o a un ilustrador de personajes, Hollywood está preocupado, y entusiasmado. Depende de a quién le preguntes.

Después de ver a Sora, Tyler Perry indicó que pausaría la expansión de 800 millones de dólares de su estudio, diciendo que esta tecnología podría ahorrar dinero en foros y filmaciones en exteriores, pero que también era motivo de preocupación. Jeanette Moreno King, presidenta del Animation Guild, que representa a los artistas de animación en Hollywood y en todo EU, consideró que todavía se necesitarán seres humanos para decisiones artísticas, pero que "el futuro es confuso". Edward Saatchi y Fable, su estudio de video de IA, están ideando el Netflix de la IA: ingresa una solicitud y obtendrás una serie completa que deseas ver.

Cuando le pregunté a Murati sobre el impacto de Sora en los empleos del ramo de producción de videos, volvió a mencionar la implementación lenta y cuidadosa, y señaló que OpenAI ha dado a estos trabajadores acceso temprano para realizar pruebas. "Queremos que la gente de la industria cinematográfica y los creadores de todo el mundo tengan voz en cómo la desarrollamos más", destacó.


Fuente de nota e imagen: https://www.elnorte.com/hizo-openai-videos-de-ia-tan-buenos-que-asustan/gr/ar2773124