La Inteligencia Artificial Generativa, detrás de ChatGPT, requiere de la construcción y entrenamiento de modelos de aprendizaje.
A fines del 2022, la empresa OpenAI puso a disposición del público una aplicación de Chat inteligente basada en el modelo de lenguaje (LLM) GPT-3. Esta aplicación se llama ChatGPT y es la responsable de haber causado una explosión en el interés en la Inteligencia Artificial (IA).
La velocidad en que ChatGPT ha logrado adquirir usuarios no tiene precedentes en la historia. Ninguna aplicación, ni aquellas más populares han tenido un crecimiento tan explosivo, que llegó a in millón de usuarios en solo 5 días. A Instagram le tomó 75 días y a Spotify 5 meses completos llegar a ese número.
La explosión de la Inteligencia Artificial Generativa
¿Cómo se explica este enorme interés en la IA? Porque al usar por primera vez esta aplicación uno no puede dejar de asombrarse ante algo que se siente “inteligente”. Realmente pareciera que uno interactúa con un ser humano. No solo es posible preguntar en lenguaje natural sino solicitar que la herramienta genere todo tipo de contenidos, desde un email a un reporte, a un cuento o a una presentación completa.
La IA incluye una componente fundamental que le permite aprender desde los ejemplos: el machine learning o aprendizaje automático. Esto ha permitido construir sistemas capaces de determinar con mucha precisión, por ejemplo, si una lesión en la piel es cancerosa o si una secuencia de transacciones es fraudulenta.
Pero la Inteligencia Artificial Generativa avanza mas allá en cuanto a que es capaz de “crear” contenidos nuevos. En realidad no es que se creen contenidos de la nada sino que estos se generan usando un modelo de lenguaje gigantesco que encapsula una gran cantidad de conocimiento.
Seguramente has tenido la experiencia de hacer una búsqueda en Google y que éste te complete lo que estabas pensando escribir. A veces es la palabra pero también puede ser una frase completa. La Inteligencia Artificial Generativa lleva esta idea más allá: le doy una idea para comenzar un cuento infantil y es capaz de generar el cuento completo a partir de ello. En el fondo, es llevar esta capacidad de predecir lo que viene a un grado mucho mayor.
Modelos de entrenamiento
Hemos mencionado, al pasar, que la IA Generativa requiere de la construcción y entrenamiento de modelos. Estos modelos se conocen como LLM (Large Language Models) o tambien como Foundation Models. Y se elaboran entrenándolos mediante algoritmos de machine learning sobre una colección enorme de textos que incluyen libros, artículos, contenido publicado en la Web, etc. Esto les permite adquirir un conocimiento muy extenso en el uso de uno o mas lenguajes naturales (los que usamos los humanos para comunicarnos).
Desarrollar un LLM es una tarea gigantesca por lo que no muchas empresas pueden hacerlo. Tal vez el modelo mas conocido y popular hoy en día es GPT desarrollado por la empresa OpenAI (comprada por MS) y que pasó al primer plano mundial por ser el primero (a fines de 2022) en poner al alcance de todos una aplicación de tipo chat. Esta herramienta se basó originalmente en la versión 3 del modelo. La última versión es la 4 (GPT4). Hoy en día existen numerosos modelos similares a GPT como LlaMA de la compañía Meta o Claude de Anthropic, y se han construido muchas herramientas basadas en ellos.
Una vez que tenemos construido este modelo (LLM), el trabajo de ChatGPT es relativamente simple y fácil de entender. Supongamos que el prompt (lo que yo ingreso a la herramienta) es: “Cuál es el nombre de la esposa de Obama?”. Lo primero que hace la herramienta es tokenizar este imput de la forma [“cual”, “nombre”, “esposa”, “obama”]. El segundo paso es calcular lo que se denomina “embedings” que son números que representan la cercanía de cada uno de esos tokens con otros tokens. Los embedings de cada uno de los tokens constituyen una matriz que permitirá construir una gran matriz de números que es la que, a su vez, nos va a permitir hacer la predicción.
Creación de códigos
Esto es muy simplificado y que hay muchos detalles adicionales. Por ejemplo, que no siempre se predice la palabra que tiene la mayor probabilidad (sería muy aburrido y generaría siempre lo mismo) sino que se introduce un elemento aleatorio.
La Inteligencia Artificial Generativa es capaz de crear también código computacional en un determinado lenguaje de programación usando la misma estrategia. Es capaz de generar contenido gráfico (imágenes) o incluso segmentos de video a partir de descripciones en texto de lo que se busca.
Es indudable que la IA generativa ha abierto un nuevo universo de posibilidades que va a cambiar en forma muy profunda la forma en que trabajamos o aprendemos. Sin embargo, hay que estar atentos a importantes dilemas éticos que esto trae consigo: facilidad para la distribución de contenido falso, propiedad intelectual, originalidad y autenticidad, entre otros.
Infórmate sobre el curso “ChatGPT: aumenta tu productividad” (a distancia) de Teleduc