OpenAI está lanzando una versión más rápida y más barata del modelo de inteligencia artificial que apoya su chatbot, ChatGPT.
Durante un evento transmitido en vivo el lunes, OpenAI debutó GPT-4.o. Es una versión actualizada de su modelo GPT-4, que ahora tiene más de un año. El nuevo modelo de gran lenguaje, entrenado en grandes cantidades de datos de Internet, será mejor en el manejo de texto, audio y vídeo en tiempo real. Las actualizaciones estarán disponibles en las próximas semanas.
Haga una pregunta verbalmente, y el sistema puede responder con una respuesta de audio en milisegundos, según la compañía, permitiendo una conversación más fluida. Asimismo, si se envía al sistema un mensaje de imagen, puede responder con una imagen.
“Esta es la primera vez que estamos haciendo un gran salto en la interacción y la facilidad de uso”, dijo Mira Murati, directora de tecnología de OpenAI, a Bloomberg News. “Realmente estamos haciendo posible que usted colabore con herramientas como ChatGPT.”
La actualización traerá una serie de características a los usuarios gratuitos que anteriormente se habían limitado a aquellos con una suscripción paga a ChatGPT, como la capacidad de buscar en la web las respuestas a las consultas, hablar con el chatbot y escuchar la respuesta en varias voces, y ordenarlo a almacenar detalles que el Chatbot puede recordar en el futuro.
El lanzamiento de GPT-4o está a punto de sacudir el paisaje de la IA en rápida evolución, donde GPT-4 sigue siendo el estándar de oro. Un número creciente de startups y empresas de Big Tech, incluyendo Anthropic, Cohere y Google de Alphabet Inc., han expulsado recientemente modelos de IA que dicen que coinciden o superan el rendimiento de GPT-4 en ciertos parámetros.
El anuncio de OpenAI también viene el día antes de la conferencia de desarrolladores de Google I/O. Google, un primer líder en el espacio de la inteligencia artificial, se espera que use el evento para revelar más actualizaciones de IA después de la carrera para mantener el ritmo con OpenAI respaldado por Microsoft Corp.
En lugar de depender de diferentes modelos de IA para procesar diferentes entradas, GPT-4o —el “o” se refiere a omni— combina voz, texto y visión en un único modelo, lo que le permite ser más rápido que su predecesor. La compañía dijo que el nuevo modelo es dos veces más rápido y significativamente más eficiente.
“Cuando tienes tres modelos diferentes que trabajan juntos, introduces mucha latencia en la experiencia, y rompe la inmersión de la experiencia”, dijo Murati. “Pero cuando tienes un modelo que razona nativamente a través de audio, texto y visión, entonces cortas toda la latencia y puedes interactuar con ChatGPT más como estamos interactuando ahora.”
Pero el nuevo modelo golpeó algunos golpes. El audio se cortó con frecuencia mientras los investigadores hablaban durante su demostración. El sistema de IA también sorprendió al público cuando, después de entrenar a un investigador a través del proceso de resolver un problema de álgebra, entró con una voz flirtativa: “Wow, ese es el traje que tienes en”.
OpenAI está comenzando a lanzar las nuevas capacidades de texto e imagen de GPT-4o a algunos usuarios de ChatGPT Plus y Team que pagan hoy, y está ofreciendo esas capacidades a los usuarios empresariales pronto. La compañía hará la nueva versión de su asistente de “modo de voz” disponible para los usuarios de ChatGPT Plus en las próximas semanas.
Como parte de sus actualizaciones, OpenAI dijo que también está permitiendo a cualquiera acceder a su GPT Store, que incluye chatbots personalizados hechos por los usuarios. Anteriormente, sólo estaba disponible para los clientes que pagaban.
La especulación sobre el próximo lanzamiento de OpenAI se ha convertido en un juego de silicon valley en las últimas semanas. Un misterioso nuevo chatbot causó una agitación entre los observadores de IA después de que apareciera en un sitio web de benchmarking y parecía competir con el rendimiento de GPT-4. El director ejecutivo de OpenAI, Sam Altman, ofreció referencias al chatbot en X, alimentando rumores de que su compañía estaba detrás.
La compañía está trabajando en una amplia gama de productos, incluyendo tecnología de voz y software de vídeo. OpenAI también está desarrollando una función de búsqueda para ChatGPT, Bloomberg informó anteriormente.
El viernes, la compañía suprimió algunas de las especulaciones febriles diciendo que no lanzaría en breve el GPT-5, una versión muy esperada de su modelo que algunos en el mundo de la tecnología esperan ser radicalmente más capaces que los sistemas actuales de IA. También dijo que no revelaría un nuevo producto de búsqueda, una herramienta que podría competir con Google. Las acciones de Google fueron más altas en las noticias.
Pero después de que el evento se envuelve, Altman fue rápido para mantener la especulación en marcha. “Tendremos más cosas que compartir pronto”, escribió en X.