fbpx
Temps de lecture : 2 min

L’Intelligence Artificielle qui transcrit les dialogues parlés sur la version standard de la plateforme peut transformer les mots “corn” (maïs en français) par “porno” (porno en fr) , “beach” (plage en fr) par “bitch”  (pute en fr) et “brave” (courage en fr) par “rape” (viol en fr)….

On vous explique

A peu près 400 000 personnes sont abonnées à la chaine YouTube Rob the Robot qui propose des une série de vidéos préscolaires et  animées pour les enfants. Sur cette chaîne, les enfants suivent un robot et ses amis qui parcourent la galaxie, rencontrent des problèmes et les résolvent. Jusque là tout va bien.

 

Sauf que dans une vidéo de 2020, l’humanoïde animé et ses amis visitent une planète, l’épisode s’inspire des travaux d’Héraclès. Les jeunes spectateurs qui activent les légendes automatiques de YouTube peuvent à un moment donné, lire un personnage qui aspire à être strong and rape as Héraclès”, une traduction réalisée par les algorithmes qui ont mal interprétés et reconnus le mot “brave” .

 

Une nouvelle étude des sous-titres générés automatiquement par l’algorithmes de YouTube sur les vidéos destinées aux enfants montre comment le texte peut parfois dévier vers un langage très adulte. Sur un échantillon de plus de 7 000 vidéos provenant de 24 chaînes pour enfants les mieux classées, 40 % affichaient dans leurs sous-titres des mots figurant sur une liste de 1 300 termes “tabous”, tirés en partie d’une étude sur les jurons. Comme dans la vidéo ci-dessous du compte “Ryan’s World”, le mot “corn” devient “porn”.

Alors oui, les sous-titres permettent l’accessibilité à tous mais l’automatisation grâce aux algorithmes demandent un peu de vigilance.

Focus sur l'intelligence artificielle

Pour son sous-titrage automatique, YouTube utilise une intelligence artificielle qui transcrit automatiquement l’audio en sous-titres grâce à la technique de reconnaissance vocale. 

Le problème des intelligences artificielles, c’est que parfois elles peuvent mal entendre un mot à cause de tout un tas de conditions : environnement bruyant, accent, parasite, mauvaise prise de son… et en plus, les algorithmes ne prennent pas forcément en compte les différents sens d’un mot, les homonymes ou encore le niveau d’intensité d’un terme.

Mais c’est grâce aux internautes que l’intelligence artificielle s’améliore, c’est le machine learning. 

Comment éviter cela

Pour éviter, les problèmes de langage explicites ou de mauvaise transcription des algorithmes, la meilleure méthode est de s’aider d’eux mais pas de se reposer sur eux.

 

Vous savez combien le sous-titrage est important pour l’accessibilité ou même dans les processus d’apprentissage alors, aidez vous du sous-titrage automatisé comme première base de texte et éditez le. L’intelligence artificielle vous fait gagner du temps en transcrivant automatiquement l’audio en sous-titre mais elle ne remplace l’être humain. Une relecture doit être effectuée pour éviter ce genre d’erreur vu au-dessus.

 

Heureusement pour vous, grâce à Capté, le sous-titrage devient un jeu d’enfant. L’intelligence artificielle de notre outil vous offre une base fiable et exploitable. L’interface permet d’éditer facilement vos sous-titres et vous les exportez en un clin d’oeil !

C'est parti, je commence à sous-titrer

Sous-titrez facilement et efficacement

Laissez un commentaire

fr_FRFrançais