IA de Voz y Traducción

NVIDIA Riva

Cree e implemente IA de voz y traducción multilingüe totalmente personalizable para su grande modelo de lenguaje y aplicaciones basadas en generación de recuperación aumentada.

Descripción General

¿Qué Es NVIDIA Riva?

NVIDIA® Riva es un conjunto de microservicios de voz y traducción multilingües acelerados por GPU para crear pipelines de IA conversacional en tiempo real totalmente personalizables. Riva incluye reconocimiento automático de voz (ASR), texto a voz (TTS) y traducción automática neuronal (NMT) y se puede implementar en todas las nubes, en data centers, en el edge y en dispositivos integrados. Con Riva, las organizaciones pueden agregar interfaces de voz y traducción con grandes modelos de lenguaje (LLM) y generación aumentada de recuperación (RAG) para transformar los chatbots en asistentes y avatares multilingües atractivos y expresivos.

NVIDIA Riva NIM Microservices—Now Available for Download

Experience new ASR, TTS and NMT microservices now available—designed to provide optimized AI inference for speech and translation AI. This includes Parakeet models that deliver recording setting ASR accuracy and performance.

Presentamos la Magia de la IA de Voz y Traducción de Extremo a Extremo

Ofrezca chatbots de IA con transcripción, traducción y voces multilingües de última generación.

Next Steps

Ready to Get Started?

Use the right tools and technologies to build and deploy fully customizable, multilingual, speech and translation AI applications.

For Developers

Explore everything you need to start developing with NVIDIA Riva, including the latest documentation, tutorials, technical blogs, and more.

Get in Touch

Talk to an NVIDIA product specialist about moving from pilot to production with the security, API stability, and support of NVIDIA AI Enterprise.

Beneficios

Explora los Beneficios de NVIDIA Riva

Transcripciones Multilingües Precisas y Voces Expresivas

Logre una alta precisión de transcripción y traducción multilingüe y proporcione voces femeninas y masculinas profesionales, expresivas y listas para usar con modelos de última generación preentrenados con miles de horas de audio en supercomputadoras NVIDIA.

Totalmente Personalizable

Personalice los pipelines de ASR para diferentes idiomas, acentos, dominios, vocabulario y contexto para obtener la mejor precisión posible para su caso de uso y los pipelines de TTS para la voz y la entonación de la marca que desee.

Implementaciones Flexibles

Proporcione experiencias coherentes a cientos de miles de usuarios simultáneos con un rendimiento de inferencia superior al de la tecnología existente, e impleméntelo en cualquier lugar: en data center, en las instalaciones, en la nube, en el edge o en dispositivos integrados.

IA de Nivel Empresarial

Acelera el desarrollo y la implementación de aplicaciones de IA de nivel de producción, multilingües y habilitadas para voz con NVIDIA AI Enterprise, una plataforma de software nativa de la nube de extremo a extremo para IA generativa segura y estable de nivel empresarial.

 

NVIDIA Riva NIMs—Now Available for Download

Experience new ASR, TTS and NMT microservices now available—designed to provide optimized AI inference for speech and translation AI. This includes Parakeet models that deliver recording setting ASR accuracy and performance.

Casos de Uso

Cómo Se Está Utilizando Riva

Descubra cómo los líderes de la industria están impulsando la innovación con Riva.

Asistentes de Preguntas y Respuestas

Las empresas están implementando asistentes de preguntas y respuestas para abordar automáticamente las consultas de millones de clientes y empleados las 24 horas del día. Con los microservicios de inteligencia artificial de voz y traducción de Riva, estos asistentes brindan respuestas útiles y naturales en cada paso de la conversación a pesar del ruido de fondo, la mala calidad del sonido y los diversos dialectos y acentos de los hablantes.

Asistencia del Agente del Centro de Contacto

Los consumidores esperan que los agentes del centro de contacto resuelvan sus problemas de manera rápida y eficiente. Para cumplir con estas expectativas y ofrecer las mejores experiencias posibles a los clientes y agentes, las empresas de todos los sectores están implementando la tecnología de asistencia a los agentes impulsada por la IA de voz y traducción de Riva.

Avatares Digitales y Embajadores de Marca

Para mejorar las experiencias de servicio al cliente y construir relaciones sólidas con sus clientes, las empresas están creando avatares con voces de marca reconocibles. Con Riva, pueden crear una voz única, personalizada y de alta calidad con solo tres segundos de datos de voz.

 

Transcripción de Videoconferencia

Con cientos de millones de reuniones en línea realizadas diariamente, las videoconferencias se han convertido en una herramienta indispensable para las empresas. A través de la transcripción en tiempo real de Riva, las aplicaciones de videoconferencia logran una precisión impresionante en subtítulos en vivo y resúmenes de reuniones, acomodando a usuarios con acentos internacionales y diversos vocabularios específicos de dominio.

Traducción

En la economía global, las empresas operan en todos los países y atienden a clientes con diversos orígenes lingüísticos y culturales. Esta diversidad en los idiomas globales plantea un desafío único, ya que contratar hablantes nativos y capacitar a los empleados en varios idiomas no es escalable, rentable ni eficiente. La traducción de Riva permite una comunicación precisa y eficaz, lo que facilita interacciones globales fluidas.

Robots de Servicio

Los robots de servicio se encuentran cada vez más en hospitales, aeropuertos y tiendas minoristas de todo el mundo. Ayudan a los trabajadores de primera línea al realizar tareas repetitivas diarias en restaurantes e instalaciones de manufactura, ayudan a los clientes a localizar artículos en las tiendas y respaldan a los médicos y enfermeras en la atención al paciente. Con Riva, es fácil agregar IA de voz y traducción a los robots de servicio.

Starting Options

Formas de Empezar a Utilizar NVIDIA Riva

Utilice las herramientas y tecnologías adecuadas para crear e implementar aplicaciones de IA de voz y traducción multilingües y totalmente personalizables.

Probar

Experimente Riva a través de un portal basado en la interfaz de usuario para explorar y crear prototipos con terminales administrados por NVIDIA, disponible de forma gratuita a través del catálogo de API de NVIDIA.

Desplegar

Obtén una licencia gratuita para probar NVIDIA AI Enterprise en producción durante 90 días con tu infraestructura existente. 

Experiencia

 

Accede a la infraestructura alojada en NVIDIA y a los laboratorios prácticos guiados que incluyen instrucciones paso a paso y ejemplos, disponibles de forma gratuita en NVIDIA LaunchPad.

Historias de Clientes

Cómo los Líderes de la Industria Están Impulsando la Innovación con Riva

Telecomunicaciones

IA de Voz para un Servicio Galardonado de Atención al Cliente

Cliente: T-Mobile

Productos: NVIDIA Riva, Sistemas Certificados por NVIDIA

Tecnologías: GPU para Data Center NVIDIA, NVIDIA NeMo, NVIDIA Riva

Telecomunicaciones

IA de Voz de Clase Mundial para la Mejor Experiencia de Videoconferencia

Cliente: RingCentral

Productos: NVIDIA DGX, NVIDIA Riva

Tecnologías: GPU para Data Center NVIDIA, NVIDIA NeMo, NVIDIA Riva, Servidor de Inferencia NVIDIA Triton

Academia / Educación Superior

Automatización del Reconocimiento de Voz Árabe en Tiempo Real

Cliente: Tarteel.ai

Productos:  NVIDIA Riva, Sistemas Certificados por NVIDIA

Tecnologías: NVIDIA NeMo, NVIDIA Riva, GPU para Data Center de NVIDIA

Adoptadores

Adoptadores Líderes en Todas las Industrias

Recursos

Lo Último en Recursos de NVIDIA Riva

Introducción a la ASR Personalizada de Alta Precisión

Aprenda a crear, entrenar, ajustar e implementar un servicio de ASR acelerado por GPU con Riva que incluya funciones personalizadas.

Hable Con Sus Datos en Su Idioma Nativo

Únase a los expertos en IA para aprender a crear, ajustar e implementar IA de voz y traducción multilingüe y lista para la producción sobre aplicaciones basadas en LLM, lo que permite que sus chatbots hablen con sus clientes en sus idiomas naturales.

Pruebe Riva en NVIDIA LaunchPad

¿Tiene un proyecto de IA del habla existente? Postúlate para obtener experiencia práctica probando y creando prototipos de tus soluciones basadas en conversaciones con habilidades de habla en la pila de software Riva de alto rendimiento que se puede implementar hoy.

Uso de la IA de Voz para la Transcripción, la Traducción y la Voz

Cree aplicaciones de IA de voz de clase mundial y totalmente personalizables, como asistentes virtuales inteligentes, servicios de transcripción de audio y avatares digitales.

 

Reinvente las Experiencias de los Centros de Contacto con NVIDIA Riva

Al generar una transcripción precisa de las interacciones con los clientes en tiempo real, Riva permite a la IA proporcionar información contextual, medir el sentimiento y recomendar la siguiente mejor acción a un agente, lo que garantiza una gran experiencia personalizada.

Un Perro Robot Lleva Bocadillos por Toda la Ciudad

Mira cómo Spot usa la IA de voz para pedir bocadillos en toda la ciudad sin conexión a Internet. En lugar de cargar comandos de voz en la nube y procesarlos en el servidor, Spot procesa todo localmente para obtener un rendimiento y una entrega eficientes y sin problemas.

 

Next Steps

Ready to Get Started?

Use the right tools and technologies to build and deploy fully customizable, multilingual, speech and translation AI applications.

For Developers

Explore everything you need to start developing with NVIDIA Riva, including the latest documentation, tutorials, technical blogs, and more.

Get in Touch

Talk to an NVIDIA product specialist about moving from pilot to production with the security, API stability, and support of NVIDIA AI Enterprise.

Más Recursos

AI2Labs

En 2021, AI2Labs se separó de Yoozoo Games como una startup tecnológica local en Singapur. AI2Labs innova, experimenta y desarrolla productos y aplicaciones de IA, permitiendo procesos eficientes y mejorando la sostenibilidad y los resultados comerciales.

AI2Labs integró Riva en su API de reconocimiento de voz Speakr (IA de voz de dominio específico) para adaptarse a las complejidades de los dominios comerciales y de voz asiáticos y logró una precisión de traducción en inglés de última generación.

Avaya

Avaya se especializa en comunicaciones en la nube y soluciones de colaboración en workflow, brindando comunicaciones unificadas, centro de contacto, plataforma de comunicaciones como servicio (CPaaS) y servicios con su plataforma OneCloud.

Avaya integró el motor de voz a texto NVIDIA Riva para subtítulos en tiempo real a escala. Riva permite una mejor calidad de transcripción, una menor tasa de errores de palabras y una entrega económica.

C-DAC

Durante más de 10 años, el Applied AI Group de C-DAC en Pune, India, se ha centrado en la investigación y el desarrollo de tecnología del habla. Han creado con éxito un sistema de voz a texto (STT) de vanguardia para idiomas índicos como el hindi y el marathi. El grupo continúa avanzando en su trabajo explorando frameworks, bibliotecas y herramientas de deep learning de código abierto y habilitados para IA para crear aplicaciones STT y habilitadas para voz para otros idiomas índicos y de bajos recursos. Se realizaron experimentos utilizando varias arquitecturas y topologías de redes neuronales del framework NeMo de código abierto de NVIDIA, y las topologías de redes Citrinet y Conformer-CTC demostraron ser efectivas en la construcción y entrenamiento de modelos acústicos neuronales para el reconocimiento de voz. Estos modelos se entrenaron en sistemas de IA Param Siddhi de uno y varios nodos, optimizando el tiempo y el rendimiento del entrenamiento. Finalmente, los modelos se implementaron para inferencia en tiempo real y en modo por lotes utilizando el proceso de producción acelerado por GPU de Riva.

NCS

NCS, una subsidiaria de Singtel Group, es una firma líder de servicios tecnológicos con presencia en Asia Pacífico y se asocia con gobiernos y empresas para hacer avanzar a las comunidades a través de la tecnología. Combinando la experiencia y los conocimientos de su equipo de 12.000 personas en 61 especializaciones, NCS ofrece servicios de tecnología diferenciados y de extremo a extremo a los clientes con sus capacidades NEXT en digital, datos, nube y plataformas, así como ofertas principales en aplicaciones e infraestructura , ingeniería y ciberseguridad. NCS también cree en la construcción de un ecosistema de socios sólido con actores tecnológicos líderes, instituciones de investigación y empresas emergentes para apoyar la innovación abierta y la cocreación.

NCS utiliza NVIDIA Riva TTS en Breeze, la aplicación complementaria del conductor, para navegación guiada por voz, actualizaciones de tráfico y condiciones de la carretera en vivo, tarifas de estacionamiento en tiempo real y tarifas y horarios de operación electrónicos para ayudar a los conductores de Singapur a experimentar viajes de conducción sin problemas.

Más Información.

breeze.com.sg/

www.ncs.co

Historia del Cliente

RingCentral

RingCentral, un proveedor líder de soluciones globales de centros de contacto, colaboración y comunicaciones en la nube empresarial, presta servicios a millones de usuarios. La plataforma RingCentral permite la colaboración desde cualquier ubicación y dispositivo, mejorando la eficiencia empresarial y la satisfacción del cliente.

RingCentral utiliza NVIDIA Riva para la transcripción de videoconferencias para 200.000 usuarios simultáneos en su plataforma.

Más Información.

www.ringcentral.com

Historia del Cliente

Sesión GTC

Snap

Snap es una empresa de cámaras y redes sociales que permite la creación de mensajes multimedia con filtros y efectos. Para crear experiencias más interactivas, los usuarios de Snapchat juegan con Lenses, una función que agrega efectos en tiempo real a las instantáneas, más de 6 mil millones de veces al día.

El servicio de IA del habla optimizado para ruido y jerga de NVIDIA Riva está integrado en Snap AR Lens Studio, lo que permite a los creadores (artistas y desarrolladores) crear apasionantes experiencias de realidad aumentada (AR).

T-Mobile

T-Mobile, un Un-carrier supercargado, ofrece una red 4G LTE avanzada y una red 5G transformadora para la mejor experiencia del cliente. Para empoderar a los agentes del centro de contacto, T-Mobile implementa Expert Assist. Este software basado en IA utiliza NVIDIA Riva para transcribir conversaciones de clientes en tiempo real que alimentan a los recomendadores y ayudan a miles de agentes.

Con Riva, T-Mobile afina los modelos de reconocimiento automático de voz en conjuntos de datos personalizados e interpreta con precisión la jerga de los clientes en entornos ruidosos.

Más Información.

www.t-mobile.com

Historia del Cliente

Sesión GTC