OpenAI da un nuevo golpe encima de la mesa al presentar Sora, una nueva inteligencia artificial que es capaz de generar vídeos a partir de un prompt. Después de crear a ChatGPT, capaz de responder preguntas y realizar distintas tareas a partir de una petición, y a DALL-E, que puede generar imágenes a partir de texto, esta empresa da el siguiente paso.
Esto no es implícitamente nuevo, ya que hay herramientas capaces de generar vídeos cortos o de crear vídeos en los que un presentador locuta un texto. Sin embargo, sorprende ver los ejemplos que OpenAI ha presentado con Sora, ya que el realismo y perfección de los vídeos asusta a la vez que asombra. Esta IA puede producir detalles concretos, imposibilitando distinguirlos de la realidad.
¿Quieres saber más sobre Sora? ¡Vamos a adentrarnos en esta inteligencia artificial!
¿Qué es y en qué consiste Sora?
Como decimos, Sora es un sistema de inteligencia artificial creado por OpenAI. Como el resto de las herramientas de esta empresa, se basa en modelos de lenguaje como GPT para crear vídeos a partir de un texto. Básicamente, Sora puede entender lo que pides con un lenguaje natural, procesarlo en segundos y darnos un resultado de bastante calidad.
Así, el funcionamiento de Sora es el mismo que el de ChatGPT o DALL-E. Tú redactas un prompt, se lo lanzas a la herramienta y te devuelve un resultado. Posteriormente, tendrás que realizar distintas modificaciones hasta que consigas el resultado esperado. Esta nueva IA de OpenAI será capaz de crear vídeos de hasta 60 segundos con todos los detalles que le pidas: tipos de personas, vestimenta, accesorios o detalles sobre el escenario.
Sin duda alguna, Sora se convierte en una auténtica revolución, ya que será capaz de crear vídeos relativamente largos con todo lujo de detalles. Hasta el momento, la IA no era demasiado potente al realizar vídeos, pero OpenAI sentará las bases de un futuro prometedor. La de inteligencias artificiales que nos esperan en un futuro facilitarán la vida de los creadores de vídeos.
Todo lo que puedes hacer con Sora
OpenAI ha compartido un gran número de ejemplos de vídeos realizados con Sora. La capacidad de mostrar detalles del entorno o de las personas ha maravillado a toda la comunidad. Y es que es capaz de entender todo lo que dices y generarlo tal y como se puede ver en el mundo real.
Por ejemplo, OpenAI ha compartido un vídeo de una mujer en Tokyo, además del prompt. En el texto podemos ver cómo se pidió que generase unas gafas de sol o pintalabios en concreto. Sora lo hizo sin ningún tipo de problemas, además de mostrar una calle húmeda llena de neones. La precisión es sorprendente, siendo incapaces de reconocer que se trata de un vídeo generado por inteligencia artificial.
Esto también nos deja un aspecto a tener en cuenta: el prompt. El resultado dependerá del texto que aportemos a la herramienta. Cuántos más detalles le demos a Sora, mejor será el resultado, ya que podrá concretar mucho más. Tocará formarse y probar con distintos prompts hasta dar con el adecuado. ¿Esto supone todo un reto, no?
¡Quiero probar a Sora! ¿Cuándo estará disponible?
De momento, lo único que sabemos es que Sora está en una fase de prueba y solo pueden acceder los investigadores de Open AI. Así, lo único que podemos hacer es ver todas las pruebas que han hecho públicas. Podemos vislumbrar todo el potencial que tiene esta herramienta y pensar en todas las utilidades que le podremos dar una vez se publique.
Otro de los aspectos que podemos ir analizando son los prompts facilitados por OpenAI. Estos prompts nos dan una visión clara de cómo interactuar con la herramienta para que aporte unos resultados más que aceptables. Aquí entran en juego los prompt creator, esos profesionales que escuchan lo que quieren las empresas y lo transforman en el prompt perfecto.
Toca esperar, ya que OpenAI sigue entrenando a Sora con miles de vídeos. Es así como esta inteligencia artificial conseguirá optimizar su rendimiento antes de ver la luz. Una vez la vea, la misma empresa tecnológica ha señalado que la incorporará a su paquete de herramientas, junto a ChatGPT y DALL-E. ¿Subirán también el precio? Esto es más que probable, ya que también incrementan el valor que aportan.
Prompt creator: la profesión del futuro
El Prompt Creator es una figura crucial en el ámbito de la inteligencia artificial y el procesamiento del lenguaje natural. Su principal función radica en la creación de prompts, es decir, instrucciones o ejemplos que alimentan a los modelos de lenguaje, como GPT (Generative Pre-trained Transformer), con el fin de influir en su salida. Para desempeñar eficazmente esta labor, el Prompt Creator debe poseer habilidades sólidas en comprensión del lenguaje natural, creatividad, lógica y capacidad para entender las necesidades específicas del usuario o del proyecto en cuestión.
Entre las funciones clave de un Prompt Creator se encuentran la elaboración de prompts claros y precisos que orienten al modelo hacia el tipo de respuestas deseadas, así como la adaptación de estos prompts según los requisitos del contexto y las metas del desarrollo. Además, el Prompt Creator debe estar constantemente actualizado en cuanto a las últimas tendencias y avances en inteligencia artificial y procesamiento del lenguaje natural para optimizar su trabajo.
La importancia de formarse para acceder a esta profesión de futuro radica en la necesidad de adquirir habilidades especializadas en campos como la lingüística computacional, la programación, el aprendizaje automático y la inteligencia artificial. Los interesados pueden buscar formación en cursos relacionados con la ciencia de datos, la lingüística computacional o la inteligencia artificial. ¿Qué instituciones cuentan con formaciones de este tipo? Sin duda alguna, INESEM.
¡Te esperamos!