Sous-titres YouTube
Temps de lecture : 2 min

L’Intelligence Artificielle qui transcrit les dialogues parlés sur la version standard de la plateforme YouTube peut transformer les mots “corn” (maïs en français) par “porno” (porno en fr) , “beach” (plage en fr) par “bitch”  (pute en fr) et “brave” (courage en fr) par “rape” (viol en fr)….

Le problème des sous-titres YouTube

A peu près 400 000 personnes sont abonnées à la chaine YouTube Rob the Robot qui propose des une série de vidéos préscolaires et  animées pour les enfants. Sur cette chaîne, les enfants suivent un robot et ses amis qui parcourent la galaxie, rencontrent des problèmes et les résolvent. Jusque là tout va bien.

Sauf que dans une vidéo de 2020, l’humanoïde animé et ses amis visitent une planète, l’épisode s’inspire des travaux d’Héraclès. Les jeunes spectateurs qui activent les sous-titres automatiques de YouTube peuvent à un moment donné, lire un personnage qui aspire à être “strong and rape as Héraclès”, une traduction réalisée par les algorithmes qui ont mal interprétés et reconnus le mot “brave” .

Une nouvelle étude des sous-titres générés automatiquement par l’algorithme de YouTube sur les vidéos destinées aux enfants montre comment le texte peut parfois dévier vers un langage très adulte. Sur un échantillon de plus de 7 000 vidéos provenant de 24 chaînes pour enfants les mieux classées, 40 % affichaient dans leurs sous-titres des mots figurant sur une liste de 1 300 termes “tabous”, tirés en partie d’une étude sur les jurons. Comme dans la vidéo ci-dessous du compte Ryan’s World, le mot “corn” devient “porn”.

Alors oui, les sous-titres permettent l’accessibilité à tous mais l’automatisation grâce aux algorithmes demandent un peu de vigilance.

Focus sur l'intelligence artificielle à l'origine des sous-titres YouTube

Pour son sous-titrage automatique, YouTube utilise une intelligence artificielle qui transcrit automatiquement l’audio en sous-titres grâce à la technique de reconnaissance vocale

Le problème des intelligences artificielles, c’est que parfois elles peuvent mal entendre un mot à cause de tout un tas de conditions : environnement bruyant, accent, parasite, mauvaise prise de son… De plus, les algorithmes ne prennent pas forcément en compte les différents sens d’un mot, les homonymes ou encore le niveau d’intensité d’un terme.

Mais c’est grâce aux internautes que l’intelligence artificielle s’améliore, c’est le machine learning

Comment éviter les erreurs de sous-titres sur YouTube ?

Pour éviter les problèmes de langage explicites ou de mauvaise transcription des algorithmes, la meilleure méthode est de s’aider d’eux mais pas de se reposer sur eux.

Vous savez combien le sous-titrage est important pour l’accessibilité ou même dans les processus d’apprentissage alors, aidez vous du sous-titrage automatisé comme première base de texte puis éditez le. L’intelligence artificielle vous fait gagner du temps en transcrivant automatiquement l’audio en sous-titre mais elle ne remplace l’être humain. Une relecture doit être effectuée pour éviter ce genre d’erreur vu au-dessus.

Heureusement pour vous, grâce à Capté, le sous-titrage devient un jeu d’enfant. L’intelligence artificielle de notre outil vous offre une base fiable et exploitable. L’interface permet d’éditer facilement vos sous-titres et vous les exportez en un clin d’oeil ! Il ne vous reste plus qu’à vous rendre sur YouTube pour ajouter vos sous-titres.

C'est parti, je commence à sous-titrer

Sous-titrez facilement et efficacement

Laissez un commentaire

capte - transcription - sous-titres - logo capte blanc 100px

© 2023 Capté, SAS. Tous droits réservés.
Outil 100% français.

fr_FRFrançais