Una relación humana con ChatGPT

Un amigo CEO nos comentó el fin de semana: "Estuve conversando con ChatGPT sobre un problema que teníamos en operaciones y nos inspiró a resolverlo con una perspectiva que no habíamos considerado. Fue bien inesperado."

Desde su lanzamiento en noviembre de 2022, las historias de conversaciones protagonizadas por ChatGPT se han vuelto comunes. El chatbot de OpenAI no solo alcanzó los 100 millones de usuarios en 2 meses, superando el récord de TikTok (9 meses) y YouTube (18 meses), sino que también ha logrado estar en 161 países. Según Google Trends, el interés global en ChatGPT sigue escalando, superando a fenómenos como Bitcoin (serie amarilla) y celebridades como Taylor Swift (serie naranja). Sin embargo lo que más nos llama la atención es cómo ChatGPT nos ha expuesto a interactuar con la IA (inteligencia artificial) en nuestro día a día.

¿Qué impacto tiene ChatGPT?

A diciembre de 2023, era el chatbot más utilizado, superando a Bing y Gemini (Bard). Los beneficios derivados de los 78 millones de dólares invertidos en el desarrollo de GPT-4 han sido excepcionales, con OpenAI reportando ingresos de más de USD$ 2B. Pero más allá de los números, las historias de cómo ChatGPT ayuda a personas a hacer el trabajo 25% más rápido y con 40% mayor calidad, nos hace preguntarnos: ¿Cómo maximizar el uso de esta herramienta en nuestro trabajo? ¿Cuál es el talón de Aquiles de ChatGPT y qué desafíos debemos anticipar?

Nos interesa explorar cómo la "sabiduría" de ChatGPT puede hacer una diferencia tanto a nivel personal como a nivel organizacional. Con cada "momento wow" que ChatGPT nos sorprende, percibimos una nueva forma de interactuar con la tecnología, una forma que antes parecía reservada solo para las interacciones humanas.

🏠 1. Respecto al uso de ChatGPT, a los trabajadores les corresponde ser los “adultos en la casa”

#HITL (Human In The Loop)

Trabajar junto a ChatGPT es como tener un invitado “perfecto” en una cena de negocios, que se encarga naturalmente de mantener la conversación interesante, útil y diversa. Pero hay un riesgo: un invitado tan perfecto podría terminar dominando la conversación.

Ethan Mollick, académico y experto, recomienda a los usuarios de ChatGPT (y GenAI) ser “the human in the loop “. Esto significa declarar el “papel” que necesitas que ChatGPT asuma en la conversación. Idealmente darle una personalidad (Marketer, Escritor, Contador, Diseñador, etc.), un contexto (proyecto, clase, brainstorming, aprendizaje), un tono (formal, casual, profesional, descriptivo, académico, científico) y lo que esperas (código, post, reporte, tabla, email, largo, etc). Así configuras a ChatGPT para complementar tu trabajo, no para controlarlo.

Algunos ejemplos de prompts

"Estoy trabajando en un modelo predictivo de la satisfacción global de clientes para un banco y necesito tu ayuda como data scientist con experiencia aplicada. Te voy a proporcionar el código actual del modelo. Por favor, revísalo y sugiéreme mejoras basadas en tu experiencia práctica. Considera factores como la precisión del modelo, la eficiencia computacional y la relevancia de los datos utilizados."
"Necesito moderar un debate sobre innovaciones tecnológicas en el sector educativo y me gustaría que asumas el rol de un profesor de debate experimentado. Ayúdame a diseñar la estructura del debate y las reglas para los participantes. Antes de empezar, por favor, hazme todas las preguntas necesarias para entender mejor el contexto del debate, los temas a tratar y el perfil de los debatientes. Esto ayudará a asegurar que el debate sea informativo y equilibrado"
"Estoy diseñando un proceso de planificación del presupuesto para una startup tecnológica con 500 trabajadores y necesito tu asistencia como si fueras el gerente general de esta empresa. Me gustaría entrevistarte para entender tus expectativas y requisitos para este proceso. Por favor, considera aspectos como las prioridades de inversión, los objetivos a largo plazo de una empresa y la forma en que prefieres que se presente la información financiera."

Este concepto es el núcleo del enfoque HITL (Human-in-the-Loop), que enfatiza la relación entre el avance de la IA y la supervisión humana. A medida que los sistemas de GenAI aumentan su complejidad, integrar aportes humanos se vuelve clave para asegurar alineamiento con nuestros estándares éticos, sensibilidades culturales y objetivos prácticos. Este enfoque mejora la precisión y crea un proceso donde la experiencia humana guía la evolución tecnológica.

Nos corresponde “ser los adultos en la casa” al invitar a ChatGPT a nuestra empresa. Postulamos que la influencia humana es una ventaja estratégica que permite que la IA se desempeñe alineada con el quehacer de nuestras organizaciones.

🚗 2. Respecto a la confiabilidad en ChatGPT, los usuarios no podemos “quedarnos dormidos al volante”

#Hallucination

Tal como a veces estamos compartiendo un recuerdo, pero los detalles nos llegan un poco difusos, hay veces que los modelos de GenAI “crean respuestas que suenan precisas y coherentes, pero en realidad pueden ser incorrectas e imprecisas. Este fenómeno se conoce como hallucination, referenciando a que el modelo "ve" patrones inexistentes en los datos con los que fue entrenado tal como una persona ve cosas que no existen en el mundo real cuando alucina.

En un artículo del MIT se explica que las alucinaciones suceden por imprecisiones e inexactitud en los datos utilizados para entrenar los modelos genAI (Weise & Metz, 2023) y por limitaciones inherentes al diseño, al ser programados para predecir la próxima palabra, no para verificar su veracidad (O'Brien, 2023). Incluso si ChatGPT solo aprendiera de los datos más precisos, su naturaleza creativa podría llevarlo a combinar ideas de maneras nuevas y a veces incorrectas (Weise & Metz, 2023).

Pero el verdadero desafío es que ChatGPT puede sonar tan convincente que olvidamos cuestionarlo. Un estudio sobre alucinaciones de GenAI el 2023 reveló que entre el 4% y el 10% del tiempo (en distintos exámenes), las respuestas de ChatGPT incluían errores. Vectara llega a una conclusión parecida, en su "LLM Hallucination Leaderboard" muestra que los modelos más precisos, como GPT-4 tienen una tasa de alucinación del 3% al resumir un texto, mientras que el peor desempeño es de PALM 2 Chat de Google con un 27%. Y aunque expertos estiman que en el corto plazo los modelos “alucinarán menos que las personas”, coinciden en que el fenómeno no será completamente eliminado.

Confiar descuidadamente en las respuestas generadas por ChatGPT es comparable a manejar un auto mientras tratas de vencer el sueño. Los líderes tienen el desafío de estar conscientes del riesgo al que están expuestos al tomar decisiones estratégicas basadas en información no verificada, producida por algún modelo GenAI.

Fuente: Percentage of questions containing hallucinations across the two knowledge exams for ChatGPT and Bard. (Lukens & Asma, 2023)

🚨3. Con ChatGPT, la creación de contenido sigue acelerando, en consecuencia es clave distinguir la música del ruido

Según la encuesta "Creator Economy in 3D", el 94% de las marcas que trabajan con creadores de contenido están integrando GenAI. De estas, el 55% ya la utiliza en alguna capacidad y el 39% planea hacerlo en el próximo año. Los creadores de contenido ven a GenAI principalmente como una herramienta de apoyo creativo, especialmente para generar nuevas ideas.

GenAI también está revolucionando el marketing al permitir la personalización granular y la automatización de tests. La investigación sugiere que la productividad del marketing con GenAI podría aumentar entre un 5% y un 15%.

Por otro lado, las empresas están viendo un récord de postulaciones a empleos, muy similares entre sí. ¿Es sorprendente? No realmente. Es probable que muchos de estos documentos estén redactados con ayuda de ChatGPT. Los datos de Glassdoor muestran que las empresas están recurriendo más que nunca a los métodos tradicionales como las referencias de empleados actuales. Aunque las referencias constituyen solo el 5% de las postulaciones, resultan en el 30% de las contrataciones. Esto ha llevado a empresas como Meta a ofrecer bonos relevantes por referencias exitosas.

Creemos que si bien ChatGPT tiene el potencial de aumentar la calidad del contenido generado, también podría contribuir a generar más ruido. Los líderes tienen la oportunidad de preguntarse si (metafóricamente) están contribuyendo al ruido o si están componiendo música.

💡 Take-away: ¿La Conclusión Rebel?

Paradójicamente hacer empresa en la era de la Inteligencia Artificial va a requerir que las personas desarrollemos habilidades esencialmente humanas, para relacionarnos de forma responsable con las nuevas herramientas disponibles y navegar el nuevo contexto global.

“Ser los adultos en la casa” requiere desarrollar capacidad de diseño contextual. Significa hacer las preguntas correctas, establecer los bordes apropiados, entregar suficiente contexto, construir juicios para tomar decisiones basadas en evidencia, reconocer problemas éticos, y entender las sutilezas de los factores sociales y culturales. Implica hacernos cargo de que GenAI se utilice de forma ética y consistente con las prácticas organizacionales.

“No quedarse dormidos al volante” requiere desarrollar capacidad de reflexión pragmática. Significa poner atención de forma deliberada y no ingenua a los detalles que importan. Implica ser competente en descomponer problemas complejos en partes manejables, comprender las causas subyacentes y proponer soluciones aplicadas. Requiere identificar dónde pueden existir alucinaciones, para verificar que el apoyo que estamos recibiendo sea confiable. Creemos que el riesgo más grande es que la IA reduzca nuestra necesidad de reflexionar.

“Diferenciar la música del ruido” requiere desarrollar la capacidad de distinguir. Significa separar aquello que tiene sustancia de lo que no, identificar lo esencial, y aquello que realmente hace una diferencia. Implica poder hacer interpretaciones más robustas de situaciones y conversaciones. Nos desafía a comprender la complejidad de las otras personas que también es fuente de autenticidad.

Porque los avances tecnológicos en IA nos desafían más que nunca a desarrollar habilidades humanas.

Gracias por leernos.

Sebastián Balmaceda - Fernando Brierley

💬 Preguntas para reflexionar

Si muchas habilidades técnicas parecen reemplazables, ¿qué habilidades son por naturaleza “humanas”?
Al disminuir la barrera para generar contenido “pulido”, ¿cómo nos diferenciamos del “ruido” generado?
¿Cómo apoyar a mi equipo para desarrollar estas habilidades?

📕 Recomendación

Ver el debate sobre IA entre un historiador (Yuval Noah Harari) y un emprendedor (Mustafa Suleyman - CEO Microsoft AI): Dos visiones y backgrounds distintos. La pregunta central del debate es qué pasará en los próximos 5 años respecto a las AI, y qué significa esto para la humanidad
Leer sobre el AI FOMO: las grandes empresas tecnológicas (Amazon, Microsoft y Google) no quieren quedarse fuera y están invirtiendo masivamente en GenAI a pesar de un entorno desfavorable: link aquí
Revisar los logros de Nvidia: ha aumentado su valor hasta superar a Apple, alcanzando una valoración de 3 billones de dólares, lo que la sitúa como la segunda empresa más valiosa del mundo, solo detrás de Microsoft, link aquí (Jensen Huang, el CEO de Nvidia, está siendo apodado como el "Taylor Swift de la tecnología", en un fenómeno que se conoce como "Jensanity”)
Renace Siri en iOS 18: Apple Intelligence fue anunciado esta semana. Existirá integración nativa de los dispositivos Apple con ChatGPT. Link aquí