Comment générer automatiquement des sous-titres IA en temps réel pour les vidéos en ligne – Guide DualPiP + Deepgram
Comment générer automatiquement des sous-titres IA pour les vidéos sans sous-titres ?
De nombreuses vidéos en ligne n'ont pas de sous-titres, ou seulement des sous-titres auto-générés de mauvaise qualité. DualPiP 1.7.0 introduit la fonctionnalité ASR (reconnaissance automatique de la parole) qui génère des sous-titres IA de haute précision en temps réel pour n'importe quelle vidéo web, affichés directement dans la fenêtre d'incrustation vidéo et entièrement intégrés au mode apprentissage et à la traduction IA.
DualPiP ASR capture le flux audio de la vidéo dans le navigateur, l'envoie à un service de reconnaissance vocale comme Deepgram pour une transcription en temps réel, et superpose des sous-titres horodatés sur la vidéo. Si la vidéo a des sous-titres natifs de mauvaise qualité, vous pouvez aussi utiliser la recherche de sous-titres de DualPiP pour trouver de meilleurs fichiers.
Quelle est la différence entre DualPiP ASR et les sous-titres intégrés de Chrome ?
Chrome dispose d'une fonction de sous-titres en direct (Live Caption) dans Paramètres → Accessibilité. Cependant, les sous-titres disparaissent en mode incrustation vidéo — un problème majeur pour ceux qui travaillent tout en regardant des vidéos.
| Comparaison | Chrome Live Caption | DualPiP ASR |
|---|---|---|
| Incrustation vidéo | Sous-titres disparaissent en PiP | Sous-titres complets dans la fenêtre PiP |
| Précision | Moyenne | Deepgram nova-3, ponctuation automatique |
| Traduction bilingue | Fonction séparée | Intégré avec 12 moteurs de traduction, traduction IA LLM recommandée |
| Mode apprentissage | Non supporté | Panel de sous-titres, boucle AB |
| Style | Fixe | Entièrement personnalisable |
| Position | Bulle en bas du navigateur, masque la page | Superposé sur la vidéo, suit la fenêtre |
| Langues | ~20 langues | 22 langues + détection multilingue |
| Modes | Streaming uniquement | WebSocket temps réel + pré-téléchargement par lots |
Quels services de reconnaissance vocale DualPiP ASR prend-il en charge ?
DualPiP ASR utilise une architecture BYOK (Bring Your Own Key). Les requêtes vont directement du navigateur au fournisseur.
Cloud ASR : Deepgram
Deepgram utilise le modèle nova-3, l'un des modèles de reconnaissance vocale en temps réel les plus précis :
- Streaming WebSocket en temps réel : latence inférieure à 300ms
- Ponctuation intelligente : ajout automatique de la ponctuation
- 22 langues : français, anglais, allemand, japonais, espagnol et plus
- Détection multilingue : mode multi exclusif de Deepgram
- Faible coût : $0,007/minute, ~$0,84 pour un film de 2 heures
ASR local : Whisper
DualPiP prend aussi en charge les serveurs Whisper compatibles OpenAI déployés localement :
| Solution | Description |
|---|---|
| Speaches | Serveur Whisper API haute performance avec GPU |
| whisper.cpp | Implémentation C++ légère, fonctionne sur CPU |
| hwdsl2/whisper-server | Déploiement Docker en une commande |
| Tout serveur compatible OpenAI | Tout service avec endpoint /v1/audio/transcriptions |
Les backends locaux utilisent le mode de reconnaissance par lots HTTP, avec DualPiP envoyant des segments audio (par défaut 5 secondes) — entièrement gratuit et fonctionne hors ligne.
Comment obtenir le crédit gratuit de $200 de Deepgram et la clé API ?
Aucune carte bancaire requise. Deepgram offre $200 de crédit gratuit aux nouveaux utilisateurs. À $0,007/minute avec nova-3, cela couvre environ 476 heures d'audio — soit environ 238 films.
Étapes d'inscription et de création de clé API
- Visitez deepgram.com et cliquez sur Sign Up Free
- Inscrivez-vous avec Google ou email (pas de carte bancaire)
- Après connexion, accédez au Console avec un projet créé automatiquement
- Naviguez vers Settings → API Keys
- Cliquez sur Create a New API Key
- Entrez un nom (ex : « DualPiP »), choisissez Member, cliquez Create Key
- Copiez et sauvegardez la clé API immédiatement
| Info | Détails |
|---|---|
| Crédit gratuit | $200 (à l'inscription) |
| Carte bancaire | Non requise |
| Expiration | Jamais |
| Après épuisement | Pay As You Go |
| Prix nova-3 | $0,007/minute |
| $200 couvre | ~476 heures (~238 films) |
Comment configurer les sous-titres ASR dans DualPiP ?
Étape 1 : Ajouter un fournisseur ASR
- Ouvrez la page Paramètres de DualPiP
- Allez dans l'onglet ASR Settings
- Cliquez sur Add Provider
- Sélectionnez Deepgram (cloud) ou Custom Local Backend (local)
- Entrez votre clé API Deepgram ou l'adresse du serveur Whisper local
- Choisissez la langue de reconnaissance (Multilingual recommandé)
- Sauvegardez
Étape 2 : Activer les sous-titres dans la fenêtre PiP
- Ouvrez le mode incrustation vidéo DualPiP (
Ctrl+Shift+E) - Cliquez sur le bouton ASR (icône microphone)
- Activez Live Caption
- Les sous-titres apparaissent immédiatement
Raccourci Shift+A pour basculer rapidement l'ASR dans la fenêtre PiP.
Quelle est la différence entre le mode streaming et le mode pré-téléchargement ?
| Comparaison | Streaming temps réel | Pré-téléchargement par lots |
|---|---|---|
| Latence | < 300ms | Zéro après téléchargement |
| Idéal pour | Directs, contenu en temps réel | Vidéos publiées |
| Backends | Deepgram (WebSocket) | Deepgram + Whisper local |
| Couverture | Temps réel, lacunes occasionnelles | Couverture audio complète |
DualPiP utilise par défaut le mode Auto : il essaie d'abord le streaming WebSocket, et bascule automatiquement vers le pré-téléchargement si le fournisseur ne le supporte pas.
Comment utiliser les sous-titres ASR avec le mode apprentissage ?
Les sous-titres ASR de DualPiP sont compatibles avec le mode apprentissage :
- Panel de sous-titres : chaque phrase reconnue listée chronologiquement
- Boucle AB : répétition d'une phrase sélectionnée
- Pause automatique : pause après chaque phrase pour la répétition
- Affichage bilingue : combinaison avec la traduction IA
Les sous-titres ASR et les sous-titres traditionnels sont mutuellement exclusifs dans DualPiP : activer l'ASR désactive automatiquement les sous-titres traditionnels, et inversement. Si la vidéo a des sous-titres natifs de qualité, utilisez-les en priorité ou téléchargez des fichiers via la recherche de sous-titres.
Comment combiner ASR et traduction IA pour des sous-titres bilingues en temps réel ?
L'ASR et la traduction IA de DualPiP fonctionnent ensemble pour générer des sous-titres bilingues en temps réel — idéal quand la vidéo n'a pas de sous-titres natifs mais que vous avez besoin de sous-titres bilingues pour l'apprentissage des langues.
Workflow ASR + traduction IA
- L'ASR reconnaît la langue originale : Deepgram transcrit l'audio en sous-titres texte dans la langue source
- L'IA LLM traduit en temps réel : le moteur de traduction IA de DualPiP traduit les sous-titres ASR dans votre langue cible
- Sous-titres bilingues affichés ensemble : original et traduction superposés sur la vidéo en sous-titres bilingues
Pourquoi la traduction IA LLM est fortement recommandée pour les sous-titres ASR
Les sous-titres ASR sont des transcriptions vocales en temps réel avec des limites de phrases parfois incomplètes. La traduction IA LLM (DeepSeek, GPT, Claude) surpasse nettement la traduction automatique traditionnelle pour les sous-titres ASR :
| Aspect | Traduction traditionnelle | Traduction IA LLM |
|---|---|---|
| Contexte | Phrase par phrase | DualPiP envoie les N derniers sous-titres comme historique |
| Langage parlé | Traduction littérale | Comprend le contexte conversationnel |
| Noms propres | Erreurs fréquentes | Amélioré par l'intégration d'infos du film |
Cas d'utilisation adaptés
| Scénario | Description |
|---|---|
| Apprendre une langue avec des vidéos sans sous-titres | ASR reconnaît l'original + IA traduit en langue maternelle |
| Regarder des directs | Pas de sous-titres pré-fabriqués — ASR + IA en temps réel |
| Cours universitaires et en ligne | Cours sans sous-titres — ASR + IA génèrent la traduction |
| Podcasts et interviews | Contenu audio visualisé en texte via ASR, puis traduit |
DualPiP prend en charge 30+ fournisseurs de traduction IA. Pour les sous-titres ASR, nous recommandons DeepSeek V4 Flash (meilleur rapport qualité-prix) ou Groq Llama (quota gratuit, réponse la plus rapide).
Quels sites vidéo fonctionnent avec DualPiP ASR ?
| Type de plateforme | Sites supportés |
|---|---|
| Vidéo | YouTube, Netflix, Disney+, Bilibili, Crunchyroll, HiAnime |
| Apprentissage | Coursera, Udemy, TED, edX, Khan Academy |
| Direct | Twitch, YouTube Live |
| Réunions | Zoom (web), Google Meet |
Questions fréquentes
Q : Quelle est la précision de la reconnaissance vocale ASR ? Deepgram nova-3 atteint un taux d'erreur de mots (WER) inférieur à 8% en anglais. Le français et les autres langues offrent également d'excellents résultats.
Q : Que se passe-t-il après épuisement du crédit de $200 ? Passage automatique au paiement à l'utilisation. Nova-3 coûte $0,007/minute. Vous pouvez aussi basculer vers Whisper local — entièrement gratuit.
Q : Les sous-titres ASR et traditionnels peuvent-ils être affichés en même temps ? Non. DualPiP les traite comme mutuellement exclusifs. Si la vidéo a de bons sous-titres natifs, utilisez-les en priorité.
Q : L'ASR est-il gratuit ou Premium ? Les sous-titres ASR sont une fonction Premium. Les sous-titres bilingues YouTube et le lecteur PiP de base sont gratuits.
Q : Quel matériel faut-il pour un backend Whisper local ?
Un GPU NVIDIA avec 6 Go+ de VRAM est recommandé. Le CPU fonctionne aussi mais plus lentement. hwdsl2/whisper-server via Docker est la méthode la plus simple.
Q : Peut-il reconnaître plusieurs langues mélangées dans une vidéo ? Le mode multilingue de Deepgram détecte et bascule automatiquement entre les langues dans le même flux audio.
Essayez les sous-titres ASR DualPiP maintenant
- Installer DualPiP : Chrome Web Store | Edge Add-ons
- Crédit gratuit Deepgram : deepgram.com (sans carte bancaire)
- Ajouter Deepgram dans les paramètres DualPiP
- Ouvrir la fenêtre PiP et activer l'ASR
Avec la traduction IA bilingue et le mode apprentissage, chaque vidéo devient un outil d'apprentissage linguistique efficace.