Google presenta Gemini, su última creación de IA en modelos generativos rival de GPT-4

En la frenética competencia por la supremacía en Inteligencia Artificial, Google da un paso audaz al presentar Gemini, su última creación en modelos generativos. Diseñado por el equipo de Google DeepMind, Gemini se erige como el principal contendiente frente a GPT-4, prometiendo llevar la IA a nuevos horizontes.

El vicepresidente de producto de Google DeepMind, Eli Collins, destaca que Gemini es un sistema multimodal nativo, capaz de interpretar estímulos en forma de texto, imágenes, videos y audio. Este avance establece un nuevo estándar, ya que Gemini no solo comprende sino que también genera razonamientos conceptuales en medio de vastas cantidades de información.

En una demostración sorprendente, Gemini resuelve problemas matemáticos, generando explicaciones paso a paso y gráficas a partir de datos. Google resalta su capacidad para extraer información de documentos, anticipando avances digitales en campos que van desde la ciencia hasta las finanzas.

Además de su versatilidad en texto, imágenes, audio y video, Gemini también domina la programación, ejecutando acciones con códigos en Python, Java, C++ y Go. La creación de AlphaCode 2, un avanzado generador de código, amplía su utilidad, resolviendo problemas de programación que involucran matemáticas complejas y ciencias de la computación teórica.

Sundar Pichai, CEO de Google, califica a Gemini como un "impulso increíble", aunque reconoce que están apenas "arañando la superficie de lo que es posible".

Google detalla que Gemini se presenta en tres tamaños diferentes para adaptarse a diversas tareas. Gemini Ultra, el modelo más grande, aborda tareas complejas, mientras que Gemini Pro se optimiza para una variedad más amplia de funciones. Por último, Gemini Nano se enfoca en eficiencia para tareas de IA en dispositivos. Google destaca su versatilidad, desde centros de datos hasta dispositivos móviles.

Bard, el asistente virtual de Google para competir con ChatGPT, incorporará una versión de Gemini Pro en inglés para un razonamiento y comprensión más avanzados. Google afirma que Gemini Pro supera a GPT-3.5 de OpenAI en la comprensión de diversos insumos.

Google anuncia que Bard con Gemini Pro está disponible para pruebas inmediatas, aunque solo para indicaciones basadas en texto y en inglés en más de 170 territorios. A principios del próximo año, Bard Advanced, impulsado por Gemini Ultra, ofrecerá un asistente aún más avanzado.

Finalmente, el lanzamiento de Gemini alivia las preocupaciones sobre la posición de Alphabet en el competitivo mercado de la inteligencia artificial, impulsando las acciones más del 5% y agregando más de US$87.000 millones al valor de mercado de las acciones.

Tags: IA Gemini Google GPT-4 ChatGPT IA ONLI