Zoom s'apprête à offrir à ses utilisateurs une nouvelle fonctionnalité étonnante, mais il faudra probablement attendre l'année prochaine pour la découvrir. Lors de sa conférence annuelle pour les développeurs, le géant de la visioconférence a annoncé le lancement d'une fonctionnalité permettant de transformer les vidéos des utilisateurs en avatars numériques réalistes, générés par l'IA.
Cet avatar numérique ne comprend pas seulement la tête, mais aussi les bras et les épaules, constituant un véritable « double numérique ». Il suffit aux utilisateurs de saisir le texte qu'ils souhaitent que l'avatar dise, et Zoom générera une audio synchronisée avec le mouvement des lèvres de l'avatar. Magique, n'est-ce pas ?
Smita Hashim, directrice des produits chez Zoom, a déclaré que cette fonctionnalité vise à aider les gens à communiquer de manière « plus rapide et plus efficace » avec leurs collègues de façon « asynchrone ». Elle a souligné que ces avatars pouvaient faire gagner aux utilisateurs un temps et une énergie précieux, tout en améliorant l'efficacité de la création de vidéos.
Cependant, cette technologie suscite également des inquiétudes. On ne peut s'empêcher de se demander si cela ne risque pas d'accroître les risques liés aux deepfakes (faux profonds).
En effet, de nombreuses entreprises ont déjà développé des technologies d'IA similaires, capables de « cloner » numériquement le visage d'une personne et de l'associer à une voix de synthèse assez naturelle. Par exemple, Tavus aide les marques à créer des personnages virtuels pour des publicités vidéo personnalisées, tandis que Microsoft a lancé l'année dernière un service permettant de générer des avatars numériques convaincants.
Mais ces outils mettent généralement en place des mesures de protection strictes pour prévenir les abus. Tavus exige une déclaration de consentement oral, tandis que Microsoft exige de ses clients qu'ils obtiennent l'autorisation écrite et le consentement de toutes les personnes dont l'image est utilisée pour créer l'avatar.
En revanche, la description des mesures de sécurité de Zoom semble quelque peu vague. Hashim a indiqué que l'entreprise mettait en place des « garanties multiples » pour la fonctionnalité d'avatars personnalisés, notamment une « authentification avancée » et des filigranes. Elle s'est engagée à continuer à examiner et à ajouter des mesures de sécurité si nécessaire.
Cette initiative de Zoom s'inscrit dans la vision ambitieuse de son PDG, Yuan Zheng, qui souhaite créer à l'avenir une IA capable de participer à des réunions Zoom, de répondre aux e-mails et même de répondre aux appels téléphoniques à votre place.
Cependant, l'apparition de cette technologie intervient à un moment où les deepfakes se propagent comme une traînée de poudre sur les médias sociaux, rendant de plus en plus difficile la distinction entre la vérité et la fiction. Cette année, des vidéos deepfakes mettant en scène le président américain Joe Biden, Taylor Swift et la vice-présidente Kamala Harris ont cumulé des millions de vues et de partages en ligne. Récemment, après le passage de l'ouragan Hélène, de nombreuses fausses images générées par l'IA ont envahi le web, montrant des scènes de destruction et de souffrance humaines fictives.
La technologie des deepfakes a également été utilisée pour cibler des individus, par exemple en se faisant passer pour un proche afin de commettre une escroquerie. Selon la Federal Trade Commission américaine, les pertes liées aux escroqueries par usurpation d'identité ont dépassé le milliard de dollars l'année dernière.
Alors, comment Zoom compte-t-il empêcher les escrocs d'utiliser son outil pour générer de fausses vidéos malveillantes ? Cela reste flou. Les images simulées fournies par l'entreprise montrent un filigrane visible dans le coin supérieur droit des vidéos d'avatars personnalisés. Mais ce filigrane peut facilement être supprimé à l'aide d'outils d'enregistrement d'écran.
Nous espérons en savoir plus lorsque Zoom prévoit de lancer cette fonctionnalité au cours du premier semestre 2025. Les utilisateurs devront alors payer un supplément de 12 dollars par mois pour utiliser les avatars personnalisés dans Zoom Clips (son outil de vidéo asynchrone).
Quelles que soient les mesures finalement prises par Zoom, des efforts de régulation sont en cours pour tenter de freiner la prolifération des deepfakes. En l'absence de législation fédérale américaine criminalisant les deepfakes, plus de 10 États ont adopté des réglementations visant l'usurpation d'identité assistée par l'IA. Une loi californienne (actuellement suspendue) serait la première à donner aux juges le pouvoir d'ordonner aux diffuseurs de contenus deepfakes de les supprimer sous peine d'amendes.
Avec le lancement de cette nouvelle fonctionnalité par Zoom, on ne peut s'empêcher de se demander : les progrès technologiques ont-ils toujours un impact positif ? En profitant des avantages de la commodité, ouvrons-nous par inadvertance la boîte de Pandore ? Chacun de nous doit y réfléchir.