Hoe genereer je automatisch AI-ondertitels voor online video's – DualPiP + Deepgram handleiding
Hoe genereer je automatisch AI-ondertitels voor video's zonder ondertiteling?
Veel online video's hebben geen ondertitels of alleen automatisch gegenereerde ondertitels van lage kwaliteit. DualPiP 1.7.0 introduceert ASR (automatische spraakherkenning) live ondertiteling die voor elke webvideo in realtime nauwkeurige AI-ondertitels genereert, weergegeven in het beeld-in-beeld venster en volledig geïntegreerd met de leermodus en AI-vertaling.
DualPiP ASR vangt de audiostream van de video op in de browser, stuurt deze naar een spraakherkenningsdienst zoals Deepgram voor realtime transcriptie, en legt ondertitels met tijdstempel over de video.
Wat is het verschil tussen DualPiP ASR en Chrome's ingebouwde live ondertiteling?
Chrome heeft ingebouwde live ondertiteling (Live Caption) onder Instellingen → Toegankelijkheid. Echter, ondertitels verdwijnen in beeld-in-beeld modus.
| Vergelijking | Chrome Live Caption | DualPiP ASR |
|---|---|---|
| Beeld-in-beeld | Ondertitels verdwijnen | Volledige ondertitels in PiP-venster |
| Nauwkeurigheid | Gemiddeld | Deepgram nova-3, automatische interpunctie |
| Tweetalige vertaling | Aparte functie | Geïntegreerd met 12 vertaalengines, AI LLM-vertaling aanbevolen |
| Leermodus | Niet ondersteund | Ondertitelpaneel, AB-lus |
| Stijl | Vast | Volledig aanpasbaar |
| Positie | Browserbubbel onderaan, bedekt pagina | Over video heen, volgt het venster |
| Talen | ~20 talen | 22 talen + meertalige detectie |
| Modi | Alleen streaming | Realtime WebSocket + pre-download batch |
Het grootste verschil is de volledige ondertitelervaring in beeld-in-beeld modus. Zodra je een video als zwevend venster opent, verdwijnen Chrome's ingebouwde ondertitels, terwijl DualPiP ASR-ondertitels altijd zichtbaar blijven in het PiP-venster — ideaal voor multitasking terwijl je talen leert.
Welke spraakherkenningsdiensten ondersteunt DualPiP ASR?
DualPiP ASR gebruikt BYOK-architectuur (Bring Your Own Key). Verzoeken gaan rechtstreeks van de browser naar de provider.
Cloud ASR: Deepgram
Deepgram gebruikt het nova-3 model — een van de nauwkeurigste realtime spraakherkenningsmodellen:
- Realtime WebSocket-streaming: latentie onder 300ms
- Slimme interpunctie: automatische leestekens en zinsgrenzen
- 22 talen: Nederlands, Engels, Duits, Frans, Japans en meer
- Meertalige detectie: automatische taalherkenning en -wisseling
- Lage kosten: $0,007/minuut, ~$0,84 per film van 2 uur
Lokale ASR: Whisper
Ondersteunt ook lokaal geïmplementeerde OpenAI-compatibele Whisper-servers:
| Oplossing | Beschrijving |
|---|---|
| Speaches | GPU-versnelde Whisper API-server |
| whisper.cpp | Lichtgewicht C++-implementatie |
| hwdsl2/whisper-server | Docker one-command deployment |
| Elke OpenAI-compatibele server | Elke dienst met /v1/audio/transcriptions endpoint |
Lokale backends gebruiken HTTP-batchherkenning — volledig gratis en werkt offline.
Hoe krijg je Deepgrams gratis $200 tegoed en API key?
Geen creditcard nodig. Deepgram biedt $200 gratis tegoed aan nieuwe gebruikers. Met nova-3 op $0,007/min dekt dit ongeveer 476 uur audio.
Stappen voor registratie en API key aanmaken
- Bezoek deepgram.com en klik op Sign Up Free
- Registreer met Google of email (geen creditcard nodig)
- Na inloggen, open de Console met automatisch aangemaakt project
- Navigeer naar Settings → API Keys
- Klik op Create a New API Key
- Voer een naam in (bijv. "DualPiP"), kies Member, klik Create Key
- Kopieer en bewaar de API key onmiddellijk — kan niet opnieuw bekeken worden
| Info | Details |
|---|---|
| Gratis tegoed | $200 (bij registratie) |
| Creditcard nodig | Nee |
| Vervaldatum | Geen |
| Na verbruik | Pay As You Go |
| Nova-3 prijs | $0,007/minuut |
| $200 dekt | ~476 uur (~238 films) |
Hoe stel je ASR live ondertiteling in DualPiP in?
Stap 1: ASR-provider toevoegen
- Open de Instellingen van DualPiP
- Ga naar de tab ASR Settings
- Klik op Add Provider
- Selecteer Deepgram (cloud) of Custom Local Backend (lokaal)
- Voer je Deepgram API key of lokaal Whisper-serveradres in
- Kies de herkenningstaal (Multilingual aanbevolen)
- Sla op
Stap 2: Live ondertiteling activeren in het PiP-venster
- Open de DualPiP PiP-modus (
Ctrl+Shift+E) - Klik op de ASR-knop (microfoonpictogram)
- Schakel Live Caption in
- Ondertitels verschijnen onmiddellijk
Sneltoets Shift+A om ASR snel te wisselen in het PiP-venster. Je kunt ook een globale sneltoets instellen via chrome://extensions/shortcuts bij "Toggle Live Captions" — zo schakel je ASR in of uit zonder het PiP-menu te openen.
Wat is het verschil tussen streaming en pre-download modus?
DualPiP ASR biedt twee modi voor het vastleggen en herkennen van audio:
Realtime streaming (WebSocket)
Audio wordt via WebSocket in realtime naar Deepgram gestuurd. Ondertitels verschijnen met minder dan 300ms vertraging, bijna gelijktijdig met de spraak. Deepgrams Interim Results-functie toont voorlopige herkenningsresultaten nog voordat het definitieve resultaat klaar is. Geschikt voor livestreams, videovergaderingen en andere content die directe feedback vereist.
Pre-download batch (HTTP)
DualPiP downloadt de video-audio vooraf en splitst deze in segmenten, die vervolgens via HTTP-verzoeken batchgewijs naar de ASR-dienst worden gestuurd. Geschikt voor gepubliceerde video's — je kunt vóór het kijken al volledige ondertitels genereren, zodat er tijdens het afspelen geen vertraging is. Pre-download werkt met zowel Deepgram als lokale Whisper-backends.
| Vergelijking | Realtime streaming | Pre-download batch |
|---|---|---|
| Latentie | < 300ms | Nul na download |
| Ideaal voor | Livestreams, realtime content | Gepubliceerde video's |
| Backends | Deepgram (WebSocket) | Deepgram + lokale Whisper |
| Volledigheid | Realtime, af en toe hiaten | Volledige audiodekking |
DualPiP gebruikt standaard Auto-modus: probeert eerst WebSocket-streaming, valt terug op pre-download batch als de provider streaming niet ondersteunt.
Hoe gebruik je ASR-ondertitels met de leermodus?
DualPiP ASR-ondertitels hebben tijdstempels en zijn compatibel met de leermodus:
- Ondertitelpaneel: elke herkende zin chronologisch opgesomd, klik om te navigeren
- AB-lus: geselecteerde zinnen herhaaldelijk afspelen voor luisteroefening
- Automatische pauze: pauze na elke zin om na te spreken
- Tweetalige weergave: combineer met AI-vertaling
ASR-ondertitels en traditionele ondertitels zijn wederzijds exclusief in DualPiP: ASR activeren schakelt automatisch traditionele ondertitels uit en omgekeerd.
Hoe combineer je ASR met AI-vertaling voor tweetalige ondertitels?
DualPiPs ASR en AI-vertaling werken samen — ideaal wanneer de video geen native ondertitels heeft maar je tweetalige ondertitels nodig hebt om talen te leren.
Workflow ASR + AI-vertaling
- ASR herkent de originele taal: Deepgram transcribeert de audio naar tekst in de brontaal
- AI LLM vertaalt in realtime: DualPiPs AI-vertaalengine vertaalt de ASR-ondertitels naar je doeltaal
- Tweetalige ondertitels samen weergegeven: origineel en vertaling als tweetalige ondertitels over de video
AI LLM-vertaling (DeepSeek, GPT, Claude) wordt sterk aanbevolen voor ASR-ondertitels — AI-modellen begrijpen de gesprekscontext en produceren natuurlijke vertalingen, zelfs bij onvolmaakte ASR-segmentatie.
| Aspect | Traditionele MT | AI LLM-vertaling |
|---|---|---|
| Context | Zin per zin | DualPiP stuurt laatste N ondertitels als gespreksgeschiedenis |
| Spreektaal | Letterlijke vertaling | Begrijpt gesprekscontext |
| Eigennamen | Frequente fouten | Verbeterd met filminfo-integratie |
Aanbevolen gebruiksscenario's
| Scenario | Beschrijving |
|---|---|
| Talen leren met video's zonder ondertitels | ASR herkent origineel + AI vertaalt naar je taal |
| Livestreams kijken | Geen voorbereide ondertitels — ASR + AI in realtime |
| Colleges en online cursussen | Cursussen zonder ondertitels — ASR + AI genereren vertalingen |
| Podcasts en interviews | Audio als tekst gevisualiseerd via ASR en dan vertaald |
DualPiP ondersteunt 30+ AI-vertalingsproviders. Wij raden DeepSeek V4 Flash (beste prijs-kwaliteitsverhouding) of Groq Llama (gratis quotum, snelste respons) aan.
Welke videosites werken met DualPiP ASR?
| Platformtype | Ondersteunde sites |
|---|---|
| Video | YouTube, Netflix, Disney+, Bilibili, Crunchyroll, HiAnime |
| Leren | Coursera, Udemy, TED, edX, Khan Academy |
| Live | Twitch, YouTube Live |
| Vergaderingen | Zoom (web), Google Meet |
| Overig | Elke website met een HTML5 <video>-element |
Voor video's zonder native ondertitels (zoals livestreams, nichevideo's en door gebruikers geüploade content zonder ondertiteling) is ASR de enige manier om ondertitels te krijgen. Gecombineerd met DualPiPs AI-vertaling genereer je realtime tweetalige ondertitels voor video's in elke taal — ASR genereert de originele tekst, AI vertaalt naar je doeltaal. Omdat ASR-ondertitels realtime spraakherkenning zijn, wordt AI LLM-vertaling sterk aanbevolen boven traditionele machinevertaling — AI begrijpt de gesprekscontext en produceert nauwkeurigere vertalingen.
Veelgestelde vragen
V: Hoe nauwkeurig is ASR-spraakherkenning? Deepgram nova-3 bereikt een woordfoutpercentage (WER) onder 8% voor Engels. Nederlands en andere talen leveren ook uitstekende resultaten.
V: Wat gebeurt er na het verbruik van het $200 tegoed? Automatische overgang naar betaling per gebruik. Nova-3 kost $0,007/minuut. Je kunt ook overschakelen naar lokale Whisper — volledig gratis.
V: Kunnen ASR-ondertitels en traditionele ondertitels tegelijk worden getoond? Nee. DualPiP behandelt ze als wederzijds exclusief.
V: Is ASR gratis of Premium? ASR live ondertiteling is een Premium-functie. YouTube in-page tweetalige ondertitels en de basis PiP-speler zijn gratis.
V: Welke hardware heb ik nodig voor een lokale Whisper-backend?
NVIDIA GPU met 6+ GB VRAM aanbevolen. CPU werkt ook maar is langzamer. hwdsl2/whisper-server via Docker is de eenvoudigste methode.
V: Kan het meerdere talen herkennen die in één video gemengd zijn? De meertalige modus van Deepgram detecteert en wisselt automatisch tussen talen in dezelfde audiostream.
Begin met DualPiP ASR live ondertiteling
- Installeer DualPiP: Chrome Web Store | Edge Add-ons
- Gratis Deepgram-tegoed: deepgram.com (geen creditcard)
- Voeg Deepgram toe in DualPiP-instellingen
- Open PiP-venster en activeer ASR
Met AI tweetalige vertaling en leermodus wordt elke video effectief taallesmateriaal.