IA de synthesia

Les clones numériques de Synthesia n’ont jamais semblé aussi proches du réel. Née en 2017 pour créer des visages capables de parler dans différentes langues, l’entreprise a progressivement affiné sa technologie jusqu’à proposer aujourd’hui des avatars hyperréalistes dotés de gestes fluides, de mimiques expressives et de voix qui préservent fidèlement l’accent des utilisateurs.

Avec son nouveau modèle Express-2, Synthesia promet des avatars encore plus convaincants pour les entreprises. Fini les regards figés et les mouvements hachés : désormais, ces clones numériques savent incarner des présentateurs crédibles pour les vidéos de formation, de communication interne ou de résultats financiers.

Pourtant, cette avancée reste troublante. Les détails trahissent encore l’artifice : une chevelure trop rigide, des mains trop lisses, ou une voix dont l’intonation sonne légèrement artificielle. Cette proximité avec le réel plonge les spectateurs dans un étrange malaise, rappelant que derrière le masque numérique, aucune émotion véritable n’existe.

Sur le plan technique, Synthesia s’appuie sur plusieurs modèles d’intelligence artificielle pour générer voix, gestes et synchronisation labiale. Le passage d’Express-1 à Express-2 a été marqué par une montée en puissance impressionnante : les modèles comptent désormais des milliards de paramètres, permettant de rendre les avatars plus expressifs sans calibration fastidieuse.

La prochaine étape ? Des avatars capables de répondre en temps réel à leurs interlocuteurs, à la manière d’un ChatGPT incarné dans un visage humain. L’entreprise explore déjà des formats interactifs pour l’apprentissage en ligne, dans lesquels un utilisateur pourrait poser une question et recevoir une réponse directement de l’avatar.

Si les perspectives sont enthousiasmantes pour la formation ou la communication, elles soulèvent aussi des inquiétudes. Des chercheurs alertent sur le risque de créer des liens affectifs forts avec ces clones, au point de brouiller la frontière entre humain et artificiel. Plus charismatiques, plus disponibles et toujours attentifs, ces avatars pourraient transformer profondément notre rapport aux autres.

Une chose est sûre : il sera de plus en plus difficile de distinguer le réel du synthétique. Et l’ère des présentateurs IA qui nous parlent — et qui nous répondent — est désormais toute proche.

Sources : MIT Technology Review