La compañía creadora de Chat GPT, el chatbot de inteligencia artificial que hace poco más de un año llegó para revolucionar el mundo, ahora sorprende con Sora, un modelo de IA que permite crear videos a partir de instrucciones de texto.
“Presentamos Sora, nuestro modelo de texto a video. Sora puede generar videos de hasta un minuto de duración manteniendo la calidad visual y el cumplimiento de las indicaciones del usuario”, afirmó la compañía en su sitio web tras su lanzamiento.
Sam Altman, CEO de OpenAI, publicó en su cuenta de X: “Nos gustaría mostrarte lo que Sora puede hacer, así que déjanos comentarios para saber lo que te gustaría ver y comenzaremos a hacer algunos”. Casi de manera inmediata, Altman recibió numerosas respuestas de usuarios que le pidieron probar la herramienta, con resultados que éstos calificaron como sorprendentes.
¿Qué puede hacer Sora?
Se trata de un nuevo modelo de IA que tiene la capacidad de crear escenas complejas que incluyen múltiples personajes, movimientos específicos y detalles precisos tanto del sujeto como del fondo. No sólo interpreta la solicitud del usuario, sino que también comprende cómo esas elementos existen en el mundo real, permitiendo una representación detallada y realista.
Según la compañía, “el modelo tiene un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes convincentes que expresan emociones vibrantes. Sora también puede crear múltiples tomas dentro de un solo video generado que persisten con precisión los personajes y el estilo visual”.
Sora tiene la capacidad no solo de producir un vídeo a partir de instrucciones de texto, sino que también puede animar una imagen estática existente con precisión y atención al detalle, creando un vídeo dinámico. Asimismo, puede ampliar o completar los fotogramas faltantes de un vídeo existente.
Debilidades
Open IA también ha destacado las debilidades de Sora, resaltando que “puede tener dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco”.
Por los momentos, Sora sólo está disponible para un reducido grupo de personas que están evaluando áreas críticas en busca de daños o riesgos, y está siendo sometido a pruebas rigurosas y polémicas para garantizar que no produzca contenido perjudicial o inadecuado. Open IA también está dando acceso a artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos.
A pesar de que se trata de una fase de pruebas, hasta ahora los resultados de Sora son muy convincentes. En este contexto, la compañía ha asegurado que tomará varias medidas de seguridad importantes antes de que este modelo esté disponible como parte de los productos de OpenAI.
Se desconoce cuándo Sora estará disponible para su uso personal o comercial, lo que sí es un hecho es que con esta novedad OpenAI sigue demostrando su innovación en inteligencia artificial y su capacidad para desarrollar herramientas avanzadas que abren nuevas posibilidades, especialmente en la creación de contenido multimedia.