
Kyutai dévoile Hibiki, une avancée dans la traduction vocale en temps réel.
Le laboratoire Kyutai, spécialisé dans la recherche ouverte en intelligence artificielle et lancé par Xavier Niel et Iliad, annonce aujourd’hui le lancement de Hibiki. Il s’agit un nouveau modèle dédié à la traduction vocale simultanée. Ce système se distingue par sa capacité à préserver la voix du locuteur tout en adaptant son rythme au sens du discours original, produisant ainsi une traduction orale et écrite plus naturelle dans la langue cible.
Actuellement conçu pour traduire du français vers l’anglais, Hibiki affiche des performances qui surpasseraient l’état de l’art dans ce domaine, notamment en matière de qualité de traduction, de fidélité vocale et de fluidité. Son processus d’inférence optimisé permet également une exécution efficace, tant dans le cloud que sur des appareils mobiles, ouvrant la voie à un usage en temps réel.
Six mois après le lancement de Moshi, son IA conversationnelle capable d’échanger sans interruption, Kyutai met à disposition de la communauté scientifique les éléments nécessaires à l’exploitation de Hibiki. Les codes d’inférence, les poids du modèle français-anglais et un rapport technique sont accessibles librement, favorisant ainsi la poursuite des recherches et l’extension du modèle à d’autres langues.
Patrick Perez, Directeur général de Kyutai, a présenté Hibiki à l’Institut Polytechnique de Paris dans le cadre de la Semaine pour l’Action sur l’Intelligence Artificielle. Cette annonce marque une nouvelle avancée dans les technologies de la voix et ouvre des perspectives en matière de communication et d’accessibilité. Avec Hibiki, comme avec Moshi auparavant, Kyutai poursuit son engagement en faveur d’une intelligence artificielle multimodale au service de la société.
Commentaires
Bonjour , avant poster, veuillez vous assurer d'avoir pris connaissance des règles.
X
Cinq consignes avant de réagir :