Vista previa de GPT-5: todo lo que sabemos hasta ahora sobre el nuevo modelo OpenAI

Publicado: 2024-03-20

Si bien la mayoría de nosotros seguimos asombrados por ChatGPT y sus capacidades en constante evolución, el CEO de OpenAI, Sam Altman, recientemente pareció poco impresionado por la oferta actual de su empresa.

Más específicamente, ha dicho que los cerebros de ChatGPT, el modelo de lenguaje grande (LLM) conocido como GPT-4, todavía "apesta". Describió el desarrollo de GPT como en una "curva exponencial" que actualmente ofrece un "vigor de algo sorprendente", pero que pronto quedará eclipsado por las capacidades de GPT-5.

Decir que esto incendió Internet sería exagerar, pero hizo que mucha gente hablara, y gran parte de esa charla gira en torno a qué esperar de GPT-5. Aquí encontrará todo lo que sabemos hasta ahora, incluidas las últimas noticias sobre GPT-5 y algunas de nuestras propias predicciones.

¿Qué es GPT-5?

GPT es la jerga de IA abreviada para "transformador generativo preentrenado". Es un modelo de lenguaje grande, o LLM, desarrollado por OpenAI, la potencia de la IA, que sirve como marco para el chatbot de la empresa, ChatGPT, uno de los mejores chatbots de IA que existen.

Otra forma de verlo es que un modelo GPT es el cerebro de ChatGPT, o su motor, si lo prefiere. GPT-5 será el quinto lanzamiento completo de un modelo de este tipo por parte de OpenAI.

Logotipo de tiburón surf ¿Quieres navegar por la web de forma privada? ¿O parecer como si estuvieras en otro país?
Obtenga un enorme 86 % de descuento en Surfshark con esta oferta especial de tech.co.

La primera fue una prueba de concepto revelada en un artículo de investigación en 2018, y la más reciente, GPT-4, salió a la luz pública en 2023.

En este momento, todavía parece que GPT-5 está lejos de ser lanzado, aunque se ha confirmado el desarrollo del nuevo modelo y se entiende que su entrenamiento está en marcha.

Cuánto tiempo llevará esto es una pregunta sin respuesta, ya que OpenAI podría tardar todo el tiempo que quieran en perfeccionar sus capacidades básicas, o intentar lanzar la nueva versión lo antes posible para mantenerse en la pole position en la carrera armamentista de la IA.

Vista previa de GPT-5: últimas noticias y qué esperar

Cuando se trata del rumoreado lanzamiento de GPT-5, el panorama actual está dominado principalmente por la especulación, aunque hay algunos hechos concretos que ahora también conocemos.

Esto es lo que creemos que podríamos ver en GPT-5, y concluye con cuándo podría lanzarse realmente.

La fuga de GPT-4.5 sugiere una ventana de lanzamiento de junio de 2024

Como lo demuestra el lanzamiento incremental de GPT-3.5, que allanó el camino para el propio ChatGPT-4, parece que OpenAI está adoptando una estrategia de actualización incremental que hará que GPT-4.5 se lance antes que GPT-5.

Esto significa que antes de llegar a lo que podríamos ver en GPT-5, debemos hacer una pausa para considerar GPT-4.5.

De hecho, es posible que OpenAI ya haya filtrado una supuesta ventana de lanzamiento de GPT-4.5, si hay que creer en los detectives tecnológicos de Internet. Aparentemente, tanto Bing de Microsoft como el motor de búsqueda DuckDuckGo indexaron una publicación de blog de OpenAI que hace referencia a la disponibilidad de un modelo GPT-4.5 con una “fecha límite de conocimiento” de junio de 2024.

De ello se deduce que el propio GPT-4.5 podría lanzarse alrededor del verano de 2024, ya que OpenAI intenta mantenerse al día con rivales recién lanzados como Claude 3 de Anthropic y, en última instancia, allanar el camino para que GPT-5 se lance a finales de 2024 o en algún momento de 2025. .

Para agregar aún más peso al rumor de que el lanzamiento de GPT-4.5 podría ser inminente, está el hecho de que ahora puedes usar GPT-4 Turbo gratis en Copilot , mientras que anteriormente Copilot era solo una de las mejores formas de obtener GPT-4 gratis. .

Agregue el evento Microsoft Surface de marzo de 2024 e incluso tendrá una pasarela para que se muestre inicialmente GPT-4.5, dado que Microsoft es uno de los mayores socios e inversores de OpenAI e incluso forma parte de la junta directiva de la compañía.

Está en el pato pato, vamos uno pic.twitter.com/7Jw45v8ybr
– Mateo (@Matthew35342706) 12 de marzo de 2024

Se confirma que GPT-5 está en desarrollo

Además de la probabilidad de que se acerque el lanzamiento de GPT-4.5 por parte de OpenAI, ahora también hemos confirmado que la compañía está trabajando en GPT-5, por lo que su LLM de próxima generación está en desarrollo en lugar de ser solo un Una quimera de Internet.

El director ejecutivo de OpenAI, Sam Altman, lo reveló a principios de 2024, hablando con Bill Gates en el podcast Unconfuse Me del ícono tecnológico.

Espere un gran salto en los parámetros de GPT-5 frente a GPT-4

Ahora, a medida que nos acercamos a territorio más especulativo y a los rumores de GPT-5, otra cosa que sabemos más o menos con certeza es que GPT-5 ofrecerá especificaciones de aprendizaje automático significativamente mejoradas en comparación con GPT-4.

El principal probablemente sean sus parámetros, donde se espera un gran salto ya que las capacidades del GPT-5 superan ampliamente todo lo que los modelos anteriores eran capaces de hacer. No sabemos exactamente qué será esto, pero a modo de idea, el salto de los 175 mil millones de parámetros de GPT-3 a los 1,5 billones reportados de GPT-4 es un aumento de 8 a 9 veces.

Queda por ver si OpenAI puede igualar eso o no, pero podría estar surgiendo una ley de rendimientos decrecientes basada en el hecho de que es casi seguro que el salto de 115x de GPT-2 a GPT-3 nunca se repetirá.

Si OpenAI puede acercarse a un aumento de parámetros de 4 a 5 veces con GPT-5, sería un logro fenomenal, especialmente si se considera que el último punto de referencia de la industria, Claude 3 Opus de Anthropic, es un modelo de 2 billones de parámetros, por lo que incluso duplicar los parámetros de GPT-4 sería una hazaña impresionante.

Como estamos hablando de billones, el impacto de cualquier aumento será llamativo. También es seguro esperar que GPT-5 tenga una ventana de contexto más grande y una fecha límite de conocimiento más actual, con una posibilidad remota de que incluso pueda procesar cierta información (como fuentes de redes sociales) en tiempo real.

Sora y la multimodalidad al frente de GPT-5

A pesar de lo entusiasmada que está la gente por el lanzamiento aparentemente inminente de GPT-4.5, hay aún más interés en el generador de texto a video recientemente anunciado por OpenAI, denominado Sora .

Sora es la última salva en la búsqueda de OpenAI para construir una verdadera multimodalidad en sus productos en este momento, ChatGPT Plus (el nivel pago del chatbot, que cuesta $20 al mes) ofrece integración con el generador de imágenes DALL-E AI de OpenAI. Le permite crear imágenes de IA "originales" simplemente ingresando un mensaje de texto en ChatGPT.

Con Sora, podrás hacer lo mismo, sólo que obtendrás una salida de vídeo. Las primeras demostraciones de los poderes de Sora han provocado un frenesí en Internet, e incluso después de más de 10 años de ver la "próxima gran novedad" de la tecnología ir y venir, debo decir que es tremendamente impresionante.

Hay muchas posibilidades de que Sora llegue a la versión beta pública o a la disponibilidad de ChatGPT Plus incluso antes de que se lance GPT-5, pero incluso si ese es el caso, será más grande y mejor que nunca cuando finalmente aterrice el LLM de próxima generación de OpenAI.

Captura de pantalla del vídeo de Sora que muestra a una mujer caminando por Tokio de noche.

GPT-5 podría marcar el comienzo de la era del Proyecto Q* de AGI

Por supuesto, en cualquier discusión sobre GPT-5 es imposible ignorar el hecho de que, detrás de escena, OpenAI está trabajando para desarrollar no solo su conjunto actual de productos de IA, sino también para generar una nueva generación de Inteligencia General Artificial (AGI). ) tecnologías actualmente denominadas Proyecto Q* .

AGI es el término que se aplica cuando la IA se vuelve “superinteligente” o adquiere la capacidad de aprender, razonar y tomar decisiones con niveles de cognición humanos. Básicamente significa que los sistemas AGI son capaces de operar completamente independientemente de la información aprendida, acercándose así un paso más a ser seres sintientes.

Cuando las tecnologías de inteligencia artificial actuales parecen no poder evitar alucinar información o generar alguna que otra imagen racista para las bromas, es una perspectiva enormemente controvertida, por decir lo menos, y muchos dentro de la industria se oponen por motivos éticos.

Sin embargo, OpenAI es uno de sus principales defensores y con el próximo lanzamiento importante de GPT, GPT-5, existe la posibilidad de que aprendamos más sobre sus objetivos finales para la superinteligencia AGI del Proyecto Q*, si no vemos un producto terminado, según Altman. propias declaraciones.

GPT-6 también “confirmado” por OpenAI

¿Por qué adelantarnos a nosotros mismos cuando podemos adelantarnos por completo ? En otra declaración, esta vez de un evento de Y Combinator en septiembre pasado, el CEO de OpenAI, Sam Altman, hizo referencia al desarrollo no solo de GPT-5 sino también de su sucesor, GPT-6.

Afirmó que ambos todavía estaban lejos en términos de liberación; ambos apuntaban a una mayor confiabilidad a un costo menor; y como acabamos de insinuar anteriormente, ambos no llegarían a ser clasificados como productos AGI.

¿Construyendo en IA? Aquí hay joyas de una charla completa de @sama en @OpenAI, de @ycombinator
Fin de semana de reunión de antiguos alumnos:
Lecciones más importantes de los primeros días de la construcción:
Pensar a largo plazo te llevará lejos. La IA abierta experimentó [muchos] cambios. De brazos robóticos a… pic.twitter.com/ikDJ2CcS4F
– Iba Masood (@IbaMasood) 24 de septiembre de 2023

Predicciones de lanzamiento potencial de GPT-5

Según lo que hemos escuchado y visto en el pasado, nos arriesgamos a suponer que GPT-5 podría lanzarse en noviembre de 2024 en el próximo OpenAI DevDay en San Francisco.

Fue entonces cuando conocimos GPT-4 Turbo, la versión más nueva y potente de GPT-4, y si GPT-4.5 realmente se presenta este verano, entonces DevDay 2024 podría darnos nuestro primer vistazo a GPT-5.

Eso, o GPT-4.5 Turbo, podría aparecer ante el público en DevDay 2024, allanando el camino para el lanzamiento de GPT-5 en 2025 , lo que coincidiría con los comentarios recientes del CEO de OpenAI, Sam Altman.

En una entrevista de marzo de 2024 con Lex Freidman Podcast, Altman dijo que la "respuesta honesta" es que no sabe cuándo estará listo GPT-5, y dijo que su empresa tiene "muchas otras cosas importantes que lanzar" antes de su próximo lanzamiento. importante actualización de LLM.

"Mucho" presumiblemente se refiere tanto a Sora como a GPT-4.5, pero tendremos que esperar y ver.

Por otra parte, un informe de Business Insider de marzo de este año decía que fuentes anónimas habían informado a la publicación de que GPT-5 llegaría a mediados de 2024, por lo que realmente nadie lo sabe en este momento.

Historial y cronograma de lanzamiento del modelo GPT

Para tener una idea de cuándo se podría lanzar GPT-5, es útil observar cuándo se lanzaron modelos GPT anteriores. Aquí hay una descripción general del historial del modelo GPT de OpenAI.

GPT-1

El GPT original se presentó en junio de 2018 , pero solo como una prueba de concepto que forma una parte clave del artículo de investigación de OpenAI "Mejorar la comprensión del lenguaje mediante el entrenamiento previo generativo".

El modelo de 117 millones de parámetros no se lanzó al público y aún pasarían algunos años antes de que OpenAI tuviera un modelo que estuvieran felices de incluir en un producto orientado al consumidor.

GPT-2

La segunda versión fundamental de GPT se reveló por primera vez en febrero de 2019 , antes de lanzarse por completo en noviembre de ese año. Capaz de generar, resumir, traducir y razonar textos básicos, fue aclamado como un gran avance en su campo.

El modelo de 1.500 millones de parámetros fue entrenado previamente en un conjunto de datos de ocho millones de páginas web, convirtiéndose en la primera versión de GPT disponible públicamente, aunque su uso fue en gran medida de tipo experimental y limitado a la comunidad de aprendizaje automático.

GPT 3

GPT-3 representó otro gran paso adelante para OpenAI y se lanzó en junio de 2020 . El modelo de 175 mil millones de parámetros ahora era capaz de producir texto que muchos críticos consideraron indistinguible del escrito por humanos.

Aunque todavía faltaban un par de años para el lanzamiento de ChatGPT, el último esfuerzo de OpenAI hizo que todos en el mundo de la tecnología hablaran, mientras que The Guardian incluso publicó un artículo completo escrito por GPT-3 para demostrar sus capacidades hasta ahora inconcebibles.

GPT-3.5

Lanzado en marzo de 2022 , GPT-3.5 fue la base sobre la que se construyó ChatGPT. Se basó en el mismo transformador de 175 mil millones de parámetros que GPT-3, pero se ajustó y entrenó con datos hasta junio de 2021.

Al anuncio de GPT-3.5 le siguió de cerca, en noviembre de 2022, el lanzamiento de ChatGPT. El resto, como ellos dicen, es historia.

GPT-4

Como le dirá cualquiera que haya usado ChatGPT en sus primeras encarnaciones, el chatbot de IA ahora favorito del mundo tenía fallas tan obvias como tremendamente impresionantes. Presentado en marzo de 2023 , GPT-4 fue el intento de OpenAI de solucionar este problema.

Según admite el propio Altman, todavía es un trabajo en progreso, pero GPT-4 ha sido un paso adelante alucinante para la tecnología de inteligencia artificial que ahora es lo suficientemente buena como para ser ampliamente utilizada no solo por estudiantes universitarios perezosos, sino también por grandes empresas como parte de sus actividades. operaciones diarias.

Si bien OpenAI no ha confirmado el número real de parámetros GPT-4, generalmente se entiende que está en la región de 1,5 billones .