Retour à la liste
guide··Rabbitpair

Comment générer automatiquement des sous-titres IA en temps réel pour les vidéos en ligne – Guide DualPiP + Deepgram

#ASR#sous-titres en direct#reconnaissance vocale#Deepgram#extension Chrome#incrustation vidéo#apprentissage langues#sous-titres automatiques

Comment générer automatiquement des sous-titres IA pour les vidéos sans sous-titres ?

De nombreuses vidéos en ligne n'ont pas de sous-titres, ou seulement des sous-titres auto-générés de mauvaise qualité. DualPiP 1.7.0 introduit la fonctionnalité ASR (reconnaissance automatique de la parole) qui génère des sous-titres IA de haute précision en temps réel pour n'importe quelle vidéo web, affichés directement dans la fenêtre d'incrustation vidéo et entièrement intégrés au mode apprentissage et à la traduction IA.

DualPiP ASR capture le flux audio de la vidéo dans le navigateur, l'envoie à un service de reconnaissance vocale comme Deepgram pour une transcription en temps réel, et superpose des sous-titres horodatés sur la vidéo. Si la vidéo a des sous-titres natifs de mauvaise qualité, vous pouvez aussi utiliser la recherche de sous-titres de DualPiP pour trouver de meilleurs fichiers.


Quelle est la différence entre DualPiP ASR et les sous-titres intégrés de Chrome ?

Chrome dispose d'une fonction de sous-titres en direct (Live Caption) dans Paramètres → Accessibilité. Cependant, les sous-titres disparaissent en mode incrustation vidéo — un problème majeur pour ceux qui travaillent tout en regardant des vidéos.

ComparaisonChrome Live CaptionDualPiP ASR
Incrustation vidéoSous-titres disparaissent en PiPSous-titres complets dans la fenêtre PiP
PrécisionMoyenneDeepgram nova-3, ponctuation automatique
Traduction bilingueFonction séparéeIntégré avec 12 moteurs de traduction, traduction IA LLM recommandée
Mode apprentissageNon supportéPanel de sous-titres, boucle AB
StyleFixeEntièrement personnalisable
PositionBulle en bas du navigateur, masque la pageSuperposé sur la vidéo, suit la fenêtre
Langues~20 langues22 langues + détection multilingue
ModesStreaming uniquementWebSocket temps réel + pré-téléchargement par lots

Quels services de reconnaissance vocale DualPiP ASR prend-il en charge ?

DualPiP ASR utilise une architecture BYOK (Bring Your Own Key). Les requêtes vont directement du navigateur au fournisseur.

Cloud ASR : Deepgram

Deepgram utilise le modèle nova-3, l'un des modèles de reconnaissance vocale en temps réel les plus précis :

  • Streaming WebSocket en temps réel : latence inférieure à 300ms
  • Ponctuation intelligente : ajout automatique de la ponctuation
  • 22 langues : français, anglais, allemand, japonais, espagnol et plus
  • Détection multilingue : mode multi exclusif de Deepgram
  • Faible coût : $0,007/minute, ~$0,84 pour un film de 2 heures

ASR local : Whisper

DualPiP prend aussi en charge les serveurs Whisper compatibles OpenAI déployés localement :

SolutionDescription
SpeachesServeur Whisper API haute performance avec GPU
whisper.cppImplémentation C++ légère, fonctionne sur CPU
hwdsl2/whisper-serverDéploiement Docker en une commande
Tout serveur compatible OpenAITout service avec endpoint /v1/audio/transcriptions

Les backends locaux utilisent le mode de reconnaissance par lots HTTP, avec DualPiP envoyant des segments audio (par défaut 5 secondes) — entièrement gratuit et fonctionne hors ligne.


Comment obtenir le crédit gratuit de $200 de Deepgram et la clé API ?

Aucune carte bancaire requise. Deepgram offre $200 de crédit gratuit aux nouveaux utilisateurs. À $0,007/minute avec nova-3, cela couvre environ 476 heures d'audio — soit environ 238 films.

Étapes d'inscription et de création de clé API

  1. Visitez deepgram.com et cliquez sur Sign Up Free
  2. Inscrivez-vous avec Google ou email (pas de carte bancaire)
  3. Après connexion, accédez au Console avec un projet créé automatiquement
  4. Naviguez vers Settings → API Keys
  5. Cliquez sur Create a New API Key
  6. Entrez un nom (ex : « DualPiP »), choisissez Member, cliquez Create Key
  7. Copiez et sauvegardez la clé API immédiatement
InfoDétails
Crédit gratuit$200 (à l'inscription)
Carte bancaireNon requise
ExpirationJamais
Après épuisementPay As You Go
Prix nova-3$0,007/minute
$200 couvre~476 heures (~238 films)

Comment configurer les sous-titres ASR dans DualPiP ?

Étape 1 : Ajouter un fournisseur ASR

  1. Ouvrez la page Paramètres de DualPiP
  2. Allez dans l'onglet ASR Settings
  3. Cliquez sur Add Provider
  4. Sélectionnez Deepgram (cloud) ou Custom Local Backend (local)
  5. Entrez votre clé API Deepgram ou l'adresse du serveur Whisper local
  6. Choisissez la langue de reconnaissance (Multilingual recommandé)
  7. Sauvegardez

Étape 2 : Activer les sous-titres dans la fenêtre PiP

  1. Ouvrez le mode incrustation vidéo DualPiP (Ctrl+Shift+E)
  2. Cliquez sur le bouton ASR (icône microphone)
  3. Activez Live Caption
  4. Les sous-titres apparaissent immédiatement

Raccourci Shift+A pour basculer rapidement l'ASR dans la fenêtre PiP.


Quelle est la différence entre le mode streaming et le mode pré-téléchargement ?

ComparaisonStreaming temps réelPré-téléchargement par lots
Latence< 300msZéro après téléchargement
Idéal pourDirects, contenu en temps réelVidéos publiées
BackendsDeepgram (WebSocket)Deepgram + Whisper local
CouvertureTemps réel, lacunes occasionnellesCouverture audio complète

DualPiP utilise par défaut le mode Auto : il essaie d'abord le streaming WebSocket, et bascule automatiquement vers le pré-téléchargement si le fournisseur ne le supporte pas.


Comment utiliser les sous-titres ASR avec le mode apprentissage ?

Les sous-titres ASR de DualPiP sont compatibles avec le mode apprentissage :

  • Panel de sous-titres : chaque phrase reconnue listée chronologiquement
  • Boucle AB : répétition d'une phrase sélectionnée
  • Pause automatique : pause après chaque phrase pour la répétition
  • Affichage bilingue : combinaison avec la traduction IA

Les sous-titres ASR et les sous-titres traditionnels sont mutuellement exclusifs dans DualPiP : activer l'ASR désactive automatiquement les sous-titres traditionnels, et inversement. Si la vidéo a des sous-titres natifs de qualité, utilisez-les en priorité ou téléchargez des fichiers via la recherche de sous-titres.


Comment combiner ASR et traduction IA pour des sous-titres bilingues en temps réel ?

L'ASR et la traduction IA de DualPiP fonctionnent ensemble pour générer des sous-titres bilingues en temps réel — idéal quand la vidéo n'a pas de sous-titres natifs mais que vous avez besoin de sous-titres bilingues pour l'apprentissage des langues.

Workflow ASR + traduction IA

  1. L'ASR reconnaît la langue originale : Deepgram transcrit l'audio en sous-titres texte dans la langue source
  2. L'IA LLM traduit en temps réel : le moteur de traduction IA de DualPiP traduit les sous-titres ASR dans votre langue cible
  3. Sous-titres bilingues affichés ensemble : original et traduction superposés sur la vidéo en sous-titres bilingues

Pourquoi la traduction IA LLM est fortement recommandée pour les sous-titres ASR

Les sous-titres ASR sont des transcriptions vocales en temps réel avec des limites de phrases parfois incomplètes. La traduction IA LLM (DeepSeek, GPT, Claude) surpasse nettement la traduction automatique traditionnelle pour les sous-titres ASR :

AspectTraduction traditionnelleTraduction IA LLM
ContextePhrase par phraseDualPiP envoie les N derniers sous-titres comme historique
Langage parléTraduction littéraleComprend le contexte conversationnel
Noms propresErreurs fréquentesAmélioré par l'intégration d'infos du film

Cas d'utilisation adaptés

ScénarioDescription
Apprendre une langue avec des vidéos sans sous-titresASR reconnaît l'original + IA traduit en langue maternelle
Regarder des directsPas de sous-titres pré-fabriqués — ASR + IA en temps réel
Cours universitaires et en ligneCours sans sous-titres — ASR + IA génèrent la traduction
Podcasts et interviewsContenu audio visualisé en texte via ASR, puis traduit

DualPiP prend en charge 30+ fournisseurs de traduction IA. Pour les sous-titres ASR, nous recommandons DeepSeek V4 Flash (meilleur rapport qualité-prix) ou Groq Llama (quota gratuit, réponse la plus rapide).


Quels sites vidéo fonctionnent avec DualPiP ASR ?

Type de plateformeSites supportés
VidéoYouTube, Netflix, Disney+, Bilibili, Crunchyroll, HiAnime
ApprentissageCoursera, Udemy, TED, edX, Khan Academy
DirectTwitch, YouTube Live
RéunionsZoom (web), Google Meet

Questions fréquentes

Q : Quelle est la précision de la reconnaissance vocale ASR ? Deepgram nova-3 atteint un taux d'erreur de mots (WER) inférieur à 8% en anglais. Le français et les autres langues offrent également d'excellents résultats.

Q : Que se passe-t-il après épuisement du crédit de $200 ? Passage automatique au paiement à l'utilisation. Nova-3 coûte $0,007/minute. Vous pouvez aussi basculer vers Whisper local — entièrement gratuit.

Q : Les sous-titres ASR et traditionnels peuvent-ils être affichés en même temps ? Non. DualPiP les traite comme mutuellement exclusifs. Si la vidéo a de bons sous-titres natifs, utilisez-les en priorité.

Q : L'ASR est-il gratuit ou Premium ? Les sous-titres ASR sont une fonction Premium. Les sous-titres bilingues YouTube et le lecteur PiP de base sont gratuits.

Q : Quel matériel faut-il pour un backend Whisper local ? Un GPU NVIDIA avec 6 Go+ de VRAM est recommandé. Le CPU fonctionne aussi mais plus lentement. hwdsl2/whisper-server via Docker est la méthode la plus simple.

Q : Peut-il reconnaître plusieurs langues mélangées dans une vidéo ? Le mode multilingue de Deepgram détecte et bascule automatiquement entre les langues dans le même flux audio.


Essayez les sous-titres ASR DualPiP maintenant

  1. Installer DualPiP : Chrome Web Store | Edge Add-ons
  2. Crédit gratuit Deepgram : deepgram.com (sans carte bancaire)
  3. Ajouter Deepgram dans les paramètres DualPiP
  4. Ouvrir la fenêtre PiP et activer l'ASR

Avec la traduction IA bilingue et le mode apprentissage, chaque vidéo devient un outil d'apprentissage linguistique efficace.