NVIDIA lanza Jarvis el nuevo asistente virtual con inteligencia artificial que se adapta fácilmente a cada industria y dominio.
NVIDIA anunció la disponibilidad del asistente virtual Jarvis, diseñado para brindar a los desarrolladores modelos de aprendizaje profundo y herramientas de software de última generación. Es capaz de reconocer la voz de los usuarios y traducir simultáneamente (tarda menos de una décima de segundo en realizar la traducción) a otro idioma sin cometer errores, al menos eso es lo que asegura la compañía.
Este asistente llega justo cuando nos encontramos con miles de millones de horas de llamadas telefónicas, reuniones web y transmisión de contenido de video que se genera a diario. Los modelos NVIDIA Jarvis ofrecen reconocimiento automático de voz de alta precisión, así como comprensión de idiomas sobrehumanos, traducciones en tiempo real para varios idiomas y nueva conversión de texto a voz, capacidades para crear agentes de IA conversacionales expresivos que se adaptan fácilmente a cada industria y dominio.
El asistente digital es capaz de analizar las frases para pronunciarlas de acuerdo con el sentido que quiso darle la persona y, no con una voz robótica, sino con una más natural.
Para lograr que esta tecnología responda en tiempo real e interprete el sentido de las frases Nvidia explicó que entrenó a Jarvis con mil millones de páginas de texto y más de 60 mil horas de conversaciones, en diferentes idiomas.
La ventaja es que no se trata de un sistema totalmente terminado, seguirá alimentándose conforme se utilice, así, entre más textos y conversaciones los alimenten, mejor comprenderá lo que se dice y su traducción será más exacta.
Actualmente Jarvis admite seis idiomas diferentes: inglés, japonés, alemán, francés, ruso y también el español. Pero Nvidia aseguró que está trabajando para incluir más. Incluso la compañía compartió que se ha asociado con T-Mobile y Mozzilla para expandir aún más la base de datos de texto y audio para mejorar aún más el algoritmo.
Utilizando la aceleración de la GPU (Graphics Processing Unit), la canalización de voz de un extremo a otro se puede ejecutar en menos de 100 milisegundos (escuchando, entendiendo y generando una respuesta más rápido que el parpadeo de un ojo humano) y se puede implementar en la nube, en el centro de datos o en el borde, escalando instantáneamente a millones de usuarios.
"La IA conversacional es, en muchos sentidos, la IA definitiva", dijo Jensen Huang, fundador y director ejecutivo de NVIDIA. “Los avances en el aprendizaje profundo en el reconocimiento de voz, la comprensión del lenguaje y la síntesis de voz han permitido atractivos servicios en la nube. NVIDIA Jarvis saca de la nube esta IA conversacional de última generación para que los clientes alojen servicios de IA en cualquier lugar ".
NVIDIA Jarvis permitirá una nueva ola de aplicaciones basadas en lenguaje que antes no era posible, mejorando las interacciones con humanos y máquinas.
Abre la puerta a la creación de servicios tales como enfermeras digitales para ayudar a monitorear a los pacientes las 24 horas del día, aliviando al personal médico sobrecargado; asistentes en línea para comprender lo que buscan los consumidores y recomendar los mejores productos; y traducciones en tiempo real para mejorar la colaboración transfronteriza en el lugar de trabajo y permitir que los espectadores disfruten del contenido en vivo en su propio idioma.
NVIDIA también se ha asociado con Mozilla Common Voice, una colección de datos de voz de código abierto para empresas emergentes, investigadores y desarrolladores para entrenar aplicaciones, servicios y dispositivos habilitados para voz. Common Voice, el conjunto de datos de voz de dominio público en varios idiomas más grande del mundo, contiene más de 9.000 horas totales de datos de voz aportados en 60 idiomas diferentes. NVIDIA está utilizando Jarvis para desarrollar modelos previamente entrenados con el conjunto de datos y luego ofrecerlos a la comunidad de forma gratuita.
“Lanzamos Common Voice para enseñar a las máquinas cómo las personas reales hablan en sus idiomas, acentos y patrones de habla únicos”, dijo Mark Surman, director ejecutivo de Mozilla. "NVIDIA y Mozilla tienen una visión común de democratizar la tecnología de voz y garantizar que refleje la rica diversidad de personas y voces que componen Internet".
Las herramientas de IA conversacional de NVIDIA han tenido más de 45.000 descargas. Estos se pueden combinar con tecnología de cientos de socios y son compatibles con las principales bibliotecas de software, lo que permite a los desarrolladores de todo el mundo crear aplicaciones de IA conversacionales innovadoras e intuitivas.
Las funciones recientemente anunciadas se lanzarán en el segundo trimestre como parte del programa beta abierto de NVIDIA Jarvis en curso.