Il existe deux types de personnes dans ce monde : celles qui regardent des émissions de télévision avec des sous-titres et celles qui sont bizarres.  Blague à part, l'importance des sous-titres pour les vidéos ne peut être sous-estimée. En plus d'être cruciaux pour les sourds et les malentendants, les sous-titres sont également importants lorsque l'audio n'est pas disponible ou n'est pas clairement audible. Peut-être que vous regardez une vidéo dans un lieu public et que le son est noyé par le bruit ambiant. Ou peut-être que la personne qui parle dans la vidéo utilise un microphone qui n'est pas de la meilleure qualité, ou parle avec un accent ou un dialecte qui n'est pas familier au spectateur. Les légendes sont   une bonne chose. Malheureusement, le sous-titrage audio dans un flux en direct est délicat. toujours  Avant de creuser le problème du sous-titrage des flux en direct, parlons un peu de la sémantique. Saviez-vous qu'il existe une différence entre les termes   et   ?  décrit   comme : sous-titres sous-titres   Spécification HTML les sous-titres  transcription ou traduction du dialogue, adaptée lorsque le son est disponible mais non compris (par exemple parce que l'utilisateur ne comprend pas la langue de la piste audio de la ressource multimédia). Superposé sur la vidéo.  La spécification décrit   comme : les sous-titres  Transcription ou traduction du dialogue, des effets sonores, des indices musicaux pertinents et d'autres informations audio pertinentes, adaptée lorsque le son n'est pas disponible ou n'est pas clairement audible (par exemple, parce qu'il est coupé, noyé par le bruit ambiant ou parce que l'utilisateur est sourd ). Superposé sur la vidéo ; marqué comme approprié pour les malentendants.  Cela signifie que lorsque nous parlons de "sous-titres codés" pour les vidéos en direct, nous faisons généralement référence aux   , car   incluent généralement des informations descriptives. Pensez à une scène dans une émission de télévision où un acteur monte dans la voiture pour quitter la maison et dit au revoir à son conjoint. La légende de cette scène pourrait être "Au revoir, ma chérie. [le moteur de la voiture démarre]". sous-titres les sous-titres  Nous ne sommes pas près d'avoir des systèmes d'IA décrivant des informations contextuelles comme celle-ci pour nous, nous sommes donc limités à l'ajout de sous-titres purs "parole-texte" à notre flux en direct ; nous pouvons le faire en utilisant la méthode ci-dessous.    Vous remarquerez que le titre et le corps de cet article de blog utilisent les termes « légendes » ou « sous-titres codés », même si ce dont nous parlons vraiment ici, ce sont des sous-titres basés sur les définitions ci-dessus. Malheureusement, étant donné que le terme "sous-titres codés" est si souvent utilisé à mauvais escient, il est plus logique d'utiliser ce terme de manière incorrecte pour aider les développeurs à trouver cet article de blog et à apprendre comment ajouter cette fonctionnalité à leurs flux en direct. Sachez simplement que ce dont nous parlons vraiment ici, ce sont des sous-titres ! Remarque :  Ajout de sous-titres aux flux en direct Amazon IVS  La solution que nous examinons dans cet article se concentre sur la diffusion vers un flux en direct Amazon Interactive Video Service (Amazon IVS) à partir de  . OBS n'offre pas de support natif pour le sous-titrage, mais il existe plusieurs plugins qui peuvent effectuer la conversion parole-texte nécessaire et publier les sous-titres sur un flux RTMP dans le  .   Studio OBS   Format CEA-708/EIA-608 pris en charge par Amazon IVS  Pour cette démo, j'ai choisi d'utiliser le   de ratwithacompiler (  et  ). Pour commencer avec ce plugin,  et  . Une fois que vous l'avez installé dans OBS, sélectionnez   et assurez-vous que le dock   est activé.  OBS-captions-plugin   GitHub   page de plug-in   télécharge le   Installez-le Docks Captions  Ensuite, sélectionnez l'icône "engrenage" dans le dock   pour modifier les paramètres.  des sous-titres  Assurez-vous qu'une   est sélectionnée et modifiez la configuration du plug-in en fonction de vos besoins. Par exemple, le   par défaut pour moi était défini sur   secondes, mais j'ai trouvé que   secondes était une meilleure valeur.  source de sous-titres délai d'attente de légende 15.0 5.0  Une fois que vous avez enregistré votre configuration et démarré un nouveau flux en direct, le plug-in gère la conversion de votre discours en texte et produit les informations de sous-titre requises pour le flux en direct.  Pour lire les données de sous-titres avec le lecteur Amazon IVS, nous pouvons ajouter un écouteur d'événement pour écouter l'événement   (  ). TextCue   documents   ivsPlayer.addEventListener(IVSPlayer.PlayerEventType.TEXT_CUE, (evt) => { console.log(evt); }  Le gestionnaire tel que configuré ci-dessus enregistre tous les événements   entrants dans la console.  TextCue  La propriété   de l'événement   contient les données de légende.  text TextCue  Avec du HTML et du CSS, nous pouvons restituer les données de sous-titres en superposition sur l'élément   . Cette implémentation dépend fortement de vos besoins, mais vous devez prendre en compte le masquage automatique de la superposition après une période spécifiée sans données de sous-titres. <video>   https://youtu.be/spFpCIqGSm8?embedable=true  Résumé  Dans cet article, nous avons examiné comment utiliser un plug-in OBS pour convertir la parole en texte et publier ce texte sous forme de données de sous-titres sur un flux en direct Amazon IVS.

The code in this story is for educational purposes. The readers are solely responsible for whatever they build with it.

Walkthroughs, tutorials, guides, and tips. This story will teach you how to do something new or how to do something better.

Comment ajouter des sous-titres codés (CC) à un flux en direct Amazon IVS

About Author

COMMENTAIRES

ÉTIQUETTES

CET ARTICLE A ÉTÉ PARU DANS

Related Stories

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Des forums aux flux : comment les algorithmes des réseaux sociaux façonnent l'interaction numérique

Créer des produits cryptographiques centrés sur l'utilisateur : l'importance des retours clients

Appuyez pour gagner : Telegram pourrait intégrer les 10 prochains milliards d'utilisateurs de crypto avant Solana

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Des forums aux flux : comment les algorithmes des réseaux sociaux façonnent l'interaction numérique

Créer des produits cryptographiques centrés sur l'utilisateur : l'importance des retours clients

Appuyez pour gagner : Telegram pourrait intégrer les 10 prochains milliards d'utilisateurs de crypto avant Solana

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps