Los nuevos motores de inteligencia artificial (IA) como ChatGPT y Dall-E se promocionan como herramientas amigables para crear imágenes y textos y, en la teoría, lo son. Sus plataformas son intuitivas, basta con escribir en una barra lo que uno desea y la IA se encargará de materializarlo.
Sin embargo, no todas las personas tienen la misma facilidad para crear a partir de ellas porque no todos saben comunicarse efectivamente con ellas (lo sé de primera mano, ya han sido varias las ocasiones en las que he desistido de Dall-E porque no logré ilustrar lo que quería).
Con un mercado laboral que cada vez se interesará más en implementar herramientas de inteligencia artificial (y posiblemente desplazar recurso humano en el proceso), la habilidad de instruir correctamente a una IA se alza como un requisito para sobrevivir y ya tiene un nombre: prompt engineering.
¿Qué es el ‘prompt engineering’?
El prompt engineering es un concepto que todavía no tiene una traducción al español oficial, pero podemos, para fines de este artículo, tomarnos la libertad de llamarlo la ingeniería de las instrucciones. Esta no es una tarea nueva, pero sí una que ha ganado popularidad en el último año y se trata de entrenar en lenguaje natural (es decir, en palabras) a una inteligencia artificial para que esta responda de la manera adecuada.
Hoy en día, con la eclosión de los nuevos motores de IA, se ha acuñado para referirse al oficio de crear los mejores estímulos o instrucciones de texto posibles para producir las mejores respuestas posibles por parte de una inteligencia artificial.
Básicamente es, —a muy grandes rasgos y con el riesgo de la sobresimplificación— la capacidad de hablarle a la IA y que esta te entienda.
Juan Daniel Sobrado, ingeniero de instrucción autodidacta, encontró en esta habilidad una oportunidad para ganarse un ingreso extra. Bajo el alias de Ilumineer, Sobrado vende sus prompts (instrucciones, pero repito: no se trata de una traducción oficial) en PromptBase, una especie de mercado en línea donde las personas compran y venden instrucciones para diferentes inteligencias artificiales, algunas de texto, como ChatGPT y otras de imágenes, como Dall-E y Midjourney.
“Para muchos, la idea de pagar por unas líneas de texto parecía absurda. Pero yo, que conocía el trabajo que requería conseguir un buen prompt, veía que tenía todo el sentido. Muchas personas, incluyéndome a mí, pagarían unos pocos dólares por ahorrarse horas de ensayos y errores”, me dijo Sobrado por medio de un correo electrónico.
Los encargados de Sobrado suelen comenzar con una referencia. “El cliente me envía alguna imagen de ejemplo y pregunta algo del estilo ‘¿podrías hacer un prompt que genere fotos de stock como esta?’ o ‘¿podrías escribir un prompt para generar ilustraciones para un blog sobre economía?’”,
Sobrado lleva desde setiembre del 2022 ofreciendo los servicios de prompt y se ha especializado en la creación de imágenes por medio de Midjourney. A febrero del 2022, el hombre detrás de Ilumineer es el segundo más vendido en PromptBase. ¿En cuánto dinero se traduce eso? Dice haber ganado alrededor de 600 euros en las últimas cuatro semanas.
A Sobrado le gusta ver la ingeniería de las instrucciones como una especie de labor de traducción. “En el caso de la generación de imágenes, mi tarea consiste en traducir esa foto o ilustración ideal que busca el cliente en un conjunto de palabras, el prompt, que la IA entienda y que, además, genere resultados de forma consistente”.
¿Es una nueva profesión?
No necesariamente. Para Tomás De Camino, director de la Escuela de Sistemas Inteligentes de la Universidad Cenfotec, la ingeniería de las instrucciones es más un tipo de especialización que potencie una profesión ya existente, que una carrera en sí misma.
“Más que transformarse en ingenieros de instrucción, las personas van a aprender sobre ingeniería de instrucción para mejorar y amplificar sus posibilidades como profesionales en cualquiera que sea el área en que estén trabajando”, dice De Camino.
No es descabellado pensar que las personas quieran aprender esta habilidad cuando podría convertirse en una de las más cotizadas por un mercado laboral que cada vez apunta más hacia el uso de inteligencias artificiales.
Nathan, por ejemplo, es un adolescente de 15 de años australiano que en su tiempo libre vende instrucciones en PromptBase, donde ocupa el sétimo puesto de más ventas. “Con el aumento repentino de la popularidad de los servicios de inteligencia artificial, pensé que probablemente sería una potencial oportunidad de trabajo en el futuro, en especial conforme la sociedad se vuelva más dependiente de las IA”, me dijo.
¿Cómo se compone una buena instrucción/’prompt’?
No existe una receta mágica en la ingeniería de las instrucciones, sin embargo podría decirse que hay dos características vitales que se complementan entre sí: el conocimiento de la materia y el conocimiento de la herramienta.
La primera tiene que ver con esa idea de añadidura de la que habla De Camino. Una instrucción solo va a dar un resultado efectivo si la persona que dio la orden tiene el conocimiento en la materia que incumbe dicha orden.
“ChatGPT (por ejemplo) va a generar respuestas vagas o imprecisas si la pregunta es vaga o imprecisa, o va a generar ficciones si la pregunta no es clara y se presta para generar ficciones. ChatGPT no está ahí para generar cosas correctas o incorrectas, Chat GPT responde a una conversación y será tan bueno como la conversación misma”, explica De Camino.
Esto podemos aterrizarlo con un caso sencillo: Dall-E o Midjourney me dan todas las herramientas tecnológicas para crear una imagen para, por ejemplo, un banner. Sin embargo, si yo no poseo las bases de diseño publicitario y tampoco sé sobre composición, ni teoría del color ni nada que tenga que ver con crear una imagen para promocionar un producto, hay una probabilidad más alta de que el resultado no sea el deseado.
Puede, eso sí, que tope con suerte y el primer banner funcione, a final de cuentas el motor de la IA se ha entrenado con una base de información gigantesca y sabe, a pinceladas gordas, qué elementos componen un banner tradicional, no obstante la tarea se complica cuando hay que repetir el ejercicio.
“En MidJourney es fácil obtener resultados visuales impactantes, pero la dificultad de un buen prompt reside en que sea consistente”, dice Sobrado.
La segunda característica tiene que ver con el conocimiento particular de cada IA, ya que no todas funcionan de la misma manera ni responden a los mismos estímulos. En otras palabras, conocerle los recovecos.
LEA MÁS: ChatGPT, el ‘chatbot’ capaz de responder preguntas como un humano que llamó la atención de Microsoft
“Se necesita una buena comprensión del sistema de IA que se está utilizando: cómo funciona y a qué responde mejor. También debe tener la capacidad de articularse con fluidez y de una manera que sea fácil de entender para la IA”, considera Nathan.
“Dependiendo de la IA con la que estés trabajando, tienes que usar unas palabras u otras, evitar ciertos términos y ponerlas en el orden adecuado. Por ejemplo, con MidJourney, si quieres que aparezca una persona con mochila en la imagen, ‘traveler’ es un término que funcionará mucho mejor que ‘backpacker’. Es como resolver un pequeño puzzle. Y conforme vas escribiendo más prompts, mejor entiendes cómo procesa la IA las instrucciones y cómo hacer para conseguir mejores resultados”, dice Sobrado.
El español también considera que este proceso debe hacerse de la manera más “científica” posible. “Esto significa experimentar, verificar hipótesis, registrar resultados y crear una base de conocimientos propia”.
¿Cómo cambiarán las IA el mercado laboral?
La eventual incorporación de las inteligencias artificiales traerá, inevitablemente, un cambio en los esquemas laborales actuales; es natural, ha sucedido a lo largo de la historia con cada avance tecnológico. Sin embargo, De Camino considera que para suavizar los efectos de un desplazamiento laboral (que también parece ineludible al hacerse más eficientes los procesos) Costa Rica necesita empezar a tener una visión más “adaptativa” de los trabajos.
“Por ser un país en vías de desarrollo hemos estado muy orientados en la empleabilidad, o sea, en educar a las personas para empleos que ya existen. Eso hace que pensemos en que los empleos son estáticos, esa es la visión que tenemos que transformar”, dice.
LEA MÁS: ¿Cuáles son los primeros trabajos que podrían reemplazar las inteligencias artificiales?
De momento, todo apunta a que serán las tareas más mecánicas, repetitivas y protocolarias las que serán tomadas por las inteligencias artificiales, mientras que las labores de dirección humana, por medio de habilidades como las de ingeniería de las instrucciones, son las que permanecerán.
De Camino lo pone de la siguiente manera: “dependerá de la persona que esté detrás de la IA generar algo de valor con estás herramientas que, por lo menos por ahora, no pueden lograr por sí solas”.