<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=378526515676058&amp;ev=PageView&amp;noscript=1">
x
language COL arrow_drop_down

ChatGPT-4: estas son las novedades de la última versión de esta IA

El aumento en la cantidad de parámetros y que ahora es un modelo de lenguaje multimodal son algunas de las características de la reciente actualización de ChatGPT.

  • ChatGPT es un chat que funciona con inteligencia artificial. FOTO Getty
    ChatGPT es un chat que funciona con inteligencia artificial. FOTO Getty
  • Resultados de exámenes resueltos con ChatGPT. FOTO GPT-4 Technical Report
    Resultados de exámenes resueltos con ChatGPT. FOTO GPT-4 Technical Report
24 de marzo de 2023
bookmark

ChatGPT dio un paso gigante en su maratónica carrera para convertirse en uno de los chats de inteligencia artificial más potentes en el mundo. El pasado 14 de marzo, la empresa OpenAI, creadora de este prototipo, anunció que ya tiene lista la nueva versión del chatbot: se trata de ChatGPT-4.

Para entender las diferencias de esta última actualización con su antecesor (ChatGPT-3) es importante tener en cuenta que previo a llegar a este nivel existió una versión intermedia llamada ChatGPT-3.5, que fue el modelo que se popularizó y estuvo disponible desde el 30 noviembre del 2022 hasta el 13 de marzo de este año.

En estos últimos meses, a medida que la gente fue interactuando con ChatGPT, el modelo creció: se entrenó, aprendió muchísimo más. Sin embargo, su base de datos de conocimiento sigue siendo limitada a la información que había en internet hasta septiembre de 2021, según el informe GPT-4 Technical Report que publicó OpenAI el pasado 16 de marzo.

A propósito de la información con la que se construyó la más reciente versión del modelo es importante lo que ocurrió con la cantidad de parámetros (datos utilizados para el entrenamiento) con la versión 4.

Para dimensionar: en el 3.5 se necesitaron cerca de 175.000 millones de parámetros, mientras que el 4 se estima que tiene un tamaño cinco veces mayor (unos 100,000,000,000,000 de parámetros ). Aquí el tamaño sí que importa porque básicamente son los parámetros donde está almacenada la información de las palabras y esto se traduce en mayor precisión a la hora de entregar las consultas que se le hacen.

Joseph Vergel, ingeniero de machine learning en la empresa Guane Enterprises, resaltó algo clave en la evolución de ChatGPT. Dijo que en el 3.5 se evidenció un cambio en la retroalimentación con el humano: se abrió la posibilidad de sacarle provecho al modelo de lenguaje debido a que ya tenía una muy buena cantidad de palabras aprendidas y las respuestas las entregaba con contexto (relacionaba las respuestas anteriores). Ganó una mayor fluidez y coherencia en la conversación.

Al pasar al 4 se presenta una mejora considerable en la cantidad de mensajes hacia atrás que el modelo comienza a tener en cuenta. Esto significa que se aumentó las palabras de contexto para responder. Imagínese que le hace una consulta y otra y otra y si una de esas está entre las 32.000 anteriores, el chat tiene la capacidad de entenderla y relacionarla con las que ya respondió. Como cuando la mente del humano recuerda algo del pasado.

En la práctica: hay un escenario en el que se simula una entrevista, se le pide al chat en el primer mensaje que sea el presidente de Estados Unidos, Joe Biden. A medida que evoluciona la conversación se tocó el tema de Ucrania y ahí da un contexto de lo que ha pasado, pero luego en el octavo mensaje se le volvió a preguntar, por ejemplo, que cuál sería la opinión del mandatario si la próxima guerra mundial estallara con Corea, entonces en ese punto ChatGPT-4 tiene la capacidad de rebobinar todo el diálogo y dar una respuesta con el contexto de lo que ha entregado durante la interacción, tiene en cuenta sus respuestas anteriores.

“Lo que estamos viendo es que se incrementó la cantidad de texto hacia atrás que él podía ir revisando y resumiendo, para relacionarlo con la nueva. Es como cuando se tiene memoria de corto, mediano y largo plazo”, dijo Vergel. En resumen, lo que hicieron fue que aumentaron la prolongación de esa memoria, como si el 3.5 tuviera memoria a corto plazo y el 4 ya esté en el mediano plazo.

“Una de las diferencias notables es que ante una misma pregunta, la nueva versión es capaz de responder con una salida con menos palabras”, resaltó Sergio Gutiérrez, profesor de la facultad de Ingeniería de la Universidad de Antioquia.

A esto se agrega que dentro de la misma cuarta versión hay un par de diferencias: está el GPT-4 (no vision) unimodal que solamente funciona con texto y el GPT4 multimodal que procesa textos, imágenes y videos, y a su vez contestar con imágenes y videos más allá del texto.

Precisamente, este último tipo de lenguaje fue el que Microsoft incorporó en sus programas de Excel, Word y Outlook para que sea capaz no solo de entender y generar texto, sino que también ahora hace lo mismo con imágenes.

Hay más novedades

Siguiendo con la comparación entre ambas versiones de los modelos, se encuentra que el 3.5 era muy repetitivo en ciertas respuestas: repetía frases y le agregaba algo de contexto. Esto mejoró en la más reciente actualización.

El 4 tiene una característica muy importante y es que la herramienta empieza a tener un blindaje en cuanto a emitir salidas sobre temas delicados o que puedan generar controversia, son aquellos relacionados con la medicina o la geopolítica, por ejemplo. La nueva versión (ChatGPT-4) tiene una probabilidad inferior al 80 % para responder a temas no permitidos, pero se sigue conservando una probabilidad del 20 % y eso es delicado” dijo Gutiérrez.

Por otro lado, según el ingeniero Vergel, además se mejoró en el rendimiento para hacer tareas predictivas como identificar cuáles son las entidades (persona, objeto, organización o localización) dentro una frase.

Eso quedó evidente en el desempeño que obtuvo GPT-4 en varios de los exámenes académicos y profesionales de aptitud más reconocidos a nivel mundial. De acuerdo con el Technical Report, en la prueba GRE Quantitative el 3.5 obtuvo una calificación aproximada de 23%, el 4 (unimodal) logró aproximadamente 62% y el 4 (multimodal) sacó aproximadamente 80%.

Resultados de exámenes resueltos con ChatGPT. FOTO GPT-4 Technical Report
Resultados de exámenes resueltos con ChatGPT. FOTO GPT-4 Technical Report

“En este tipo de examen (razonamiento cuantitativo) generalmente las pruebas no son solo textuales, se plantea también preguntas donde el estudiante analiza imágenes, es por eso que GPT-4 multimodal alcanza un mejor rendimiento”. Tuvo la capacidad de interpretar los gráficos de la prueba.

Si estos porcentajes se llevan a un esquema de calificaciones del sistema educativo, como la escala de 0 a 10, el 4 multimodal obtuvo 8.0 puntos, lo que es un desempeño sobresaliente. En pocas palabras: GPT-4 ganó la prueba.

Definitivamente, las siguientes versiones del modelo generativo seguirán mejorando, porque a medida que aprende, al mismo tiempo sus creadores van identificando falencias, sobre todo aquellas que están relacionadas con la exactitud de las respuestas.

Y esto lleva a seguir reflexionando sobre las implicaciones éticas en torno al uso de la herramienta: abre las posibilidades de plagio en la construcción de textos. Cada vez veremos más y más textos construidos con ChatGPT en lugar de ser escritos por un autor, lo que llevará a una discusión permanente.

El nuevo ChatGPt por ahora solo está disponible pagando. Son 20USD por el paquete plus. La versión gratuita, entre tanto, sigue siendo la GPT3-3.5. Así que, salvo que pague, no verá un cambio.

Te puede interesar

El empleo que busca está a un clic

Las más leídas

Te recomendamos

Utilidad para la vida

Regístrate al newsletter

PROCESANDO TU SOLICITUD