Terug naar de lijst
guide··Rabbitpair

Hoe genereer je automatisch AI-ondertitels voor online video's – DualPiP + Deepgram handleiding

#ASR#live ondertiteling#spraakherkenning#Deepgram#Chrome-extensie#beeld-in-beeld#talen leren#automatische ondertitels

Hoe genereer je automatisch AI-ondertitels voor video's zonder ondertiteling?

Veel online video's hebben geen ondertitels of alleen automatisch gegenereerde ondertitels van lage kwaliteit. DualPiP 1.7.0 introduceert ASR (automatische spraakherkenning) live ondertiteling die voor elke webvideo in realtime nauwkeurige AI-ondertitels genereert, weergegeven in het beeld-in-beeld venster en volledig geïntegreerd met de leermodus en AI-vertaling.

DualPiP ASR vangt de audiostream van de video op in de browser, stuurt deze naar een spraakherkenningsdienst zoals Deepgram voor realtime transcriptie, en legt ondertitels met tijdstempel over de video.


Wat is het verschil tussen DualPiP ASR en Chrome's ingebouwde live ondertiteling?

Chrome heeft ingebouwde live ondertiteling (Live Caption) onder Instellingen → Toegankelijkheid. Echter, ondertitels verdwijnen in beeld-in-beeld modus.

VergelijkingChrome Live CaptionDualPiP ASR
Beeld-in-beeldOndertitels verdwijnenVolledige ondertitels in PiP-venster
NauwkeurigheidGemiddeldDeepgram nova-3, automatische interpunctie
Tweetalige vertalingAparte functieGeïntegreerd met 12 vertaalengines, AI LLM-vertaling aanbevolen
LeermodusNiet ondersteundOndertitelpaneel, AB-lus
StijlVastVolledig aanpasbaar
PositieBrowserbubbel onderaan, bedekt paginaOver video heen, volgt het venster
Talen~20 talen22 talen + meertalige detectie
ModiAlleen streamingRealtime WebSocket + pre-download batch

Het grootste verschil is de volledige ondertitelervaring in beeld-in-beeld modus. Zodra je een video als zwevend venster opent, verdwijnen Chrome's ingebouwde ondertitels, terwijl DualPiP ASR-ondertitels altijd zichtbaar blijven in het PiP-venster — ideaal voor multitasking terwijl je talen leert.


Welke spraakherkenningsdiensten ondersteunt DualPiP ASR?

DualPiP ASR gebruikt BYOK-architectuur (Bring Your Own Key). Verzoeken gaan rechtstreeks van de browser naar de provider.

Cloud ASR: Deepgram

Deepgram gebruikt het nova-3 model — een van de nauwkeurigste realtime spraakherkenningsmodellen:

  • Realtime WebSocket-streaming: latentie onder 300ms
  • Slimme interpunctie: automatische leestekens en zinsgrenzen
  • 22 talen: Nederlands, Engels, Duits, Frans, Japans en meer
  • Meertalige detectie: automatische taalherkenning en -wisseling
  • Lage kosten: $0,007/minuut, ~$0,84 per film van 2 uur

Lokale ASR: Whisper

Ondersteunt ook lokaal geïmplementeerde OpenAI-compatibele Whisper-servers:

OplossingBeschrijving
SpeachesGPU-versnelde Whisper API-server
whisper.cppLichtgewicht C++-implementatie
hwdsl2/whisper-serverDocker one-command deployment
Elke OpenAI-compatibele serverElke dienst met /v1/audio/transcriptions endpoint

Lokale backends gebruiken HTTP-batchherkenning — volledig gratis en werkt offline.


Hoe krijg je Deepgrams gratis $200 tegoed en API key?

Geen creditcard nodig. Deepgram biedt $200 gratis tegoed aan nieuwe gebruikers. Met nova-3 op $0,007/min dekt dit ongeveer 476 uur audio.

Stappen voor registratie en API key aanmaken

  1. Bezoek deepgram.com en klik op Sign Up Free
  2. Registreer met Google of email (geen creditcard nodig)
  3. Na inloggen, open de Console met automatisch aangemaakt project
  4. Navigeer naar Settings → API Keys
  5. Klik op Create a New API Key
  6. Voer een naam in (bijv. "DualPiP"), kies Member, klik Create Key
  7. Kopieer en bewaar de API key onmiddellijk — kan niet opnieuw bekeken worden
InfoDetails
Gratis tegoed$200 (bij registratie)
Creditcard nodigNee
VervaldatumGeen
Na verbruikPay As You Go
Nova-3 prijs$0,007/minuut
$200 dekt~476 uur (~238 films)

Hoe stel je ASR live ondertiteling in DualPiP in?

Stap 1: ASR-provider toevoegen

  1. Open de Instellingen van DualPiP
  2. Ga naar de tab ASR Settings
  3. Klik op Add Provider
  4. Selecteer Deepgram (cloud) of Custom Local Backend (lokaal)
  5. Voer je Deepgram API key of lokaal Whisper-serveradres in
  6. Kies de herkenningstaal (Multilingual aanbevolen)
  7. Sla op

Stap 2: Live ondertiteling activeren in het PiP-venster

  1. Open de DualPiP PiP-modus (Ctrl+Shift+E)
  2. Klik op de ASR-knop (microfoonpictogram)
  3. Schakel Live Caption in
  4. Ondertitels verschijnen onmiddellijk

Sneltoets Shift+A om ASR snel te wisselen in het PiP-venster. Je kunt ook een globale sneltoets instellen via chrome://extensions/shortcuts bij "Toggle Live Captions" — zo schakel je ASR in of uit zonder het PiP-menu te openen.


Wat is het verschil tussen streaming en pre-download modus?

DualPiP ASR biedt twee modi voor het vastleggen en herkennen van audio:

Realtime streaming (WebSocket)

Audio wordt via WebSocket in realtime naar Deepgram gestuurd. Ondertitels verschijnen met minder dan 300ms vertraging, bijna gelijktijdig met de spraak. Deepgrams Interim Results-functie toont voorlopige herkenningsresultaten nog voordat het definitieve resultaat klaar is. Geschikt voor livestreams, videovergaderingen en andere content die directe feedback vereist.

Pre-download batch (HTTP)

DualPiP downloadt de video-audio vooraf en splitst deze in segmenten, die vervolgens via HTTP-verzoeken batchgewijs naar de ASR-dienst worden gestuurd. Geschikt voor gepubliceerde video's — je kunt vóór het kijken al volledige ondertitels genereren, zodat er tijdens het afspelen geen vertraging is. Pre-download werkt met zowel Deepgram als lokale Whisper-backends.

VergelijkingRealtime streamingPre-download batch
Latentie< 300msNul na download
Ideaal voorLivestreams, realtime contentGepubliceerde video's
BackendsDeepgram (WebSocket)Deepgram + lokale Whisper
VolledigheidRealtime, af en toe hiatenVolledige audiodekking

DualPiP gebruikt standaard Auto-modus: probeert eerst WebSocket-streaming, valt terug op pre-download batch als de provider streaming niet ondersteunt.


Hoe gebruik je ASR-ondertitels met de leermodus?

DualPiP ASR-ondertitels hebben tijdstempels en zijn compatibel met de leermodus:

  • Ondertitelpaneel: elke herkende zin chronologisch opgesomd, klik om te navigeren
  • AB-lus: geselecteerde zinnen herhaaldelijk afspelen voor luisteroefening
  • Automatische pauze: pauze na elke zin om na te spreken
  • Tweetalige weergave: combineer met AI-vertaling

ASR-ondertitels en traditionele ondertitels zijn wederzijds exclusief in DualPiP: ASR activeren schakelt automatisch traditionele ondertitels uit en omgekeerd.


Hoe combineer je ASR met AI-vertaling voor tweetalige ondertitels?

DualPiPs ASR en AI-vertaling werken samen — ideaal wanneer de video geen native ondertitels heeft maar je tweetalige ondertitels nodig hebt om talen te leren.

Workflow ASR + AI-vertaling

  1. ASR herkent de originele taal: Deepgram transcribeert de audio naar tekst in de brontaal
  2. AI LLM vertaalt in realtime: DualPiPs AI-vertaalengine vertaalt de ASR-ondertitels naar je doeltaal
  3. Tweetalige ondertitels samen weergegeven: origineel en vertaling als tweetalige ondertitels over de video

AI LLM-vertaling (DeepSeek, GPT, Claude) wordt sterk aanbevolen voor ASR-ondertitels — AI-modellen begrijpen de gesprekscontext en produceren natuurlijke vertalingen, zelfs bij onvolmaakte ASR-segmentatie.

AspectTraditionele MTAI LLM-vertaling
ContextZin per zinDualPiP stuurt laatste N ondertitels als gespreksgeschiedenis
SpreektaalLetterlijke vertalingBegrijpt gesprekscontext
EigennamenFrequente foutenVerbeterd met filminfo-integratie

Aanbevolen gebruiksscenario's

ScenarioBeschrijving
Talen leren met video's zonder ondertitelsASR herkent origineel + AI vertaalt naar je taal
Livestreams kijkenGeen voorbereide ondertitels — ASR + AI in realtime
Colleges en online cursussenCursussen zonder ondertitels — ASR + AI genereren vertalingen
Podcasts en interviewsAudio als tekst gevisualiseerd via ASR en dan vertaald

DualPiP ondersteunt 30+ AI-vertalingsproviders. Wij raden DeepSeek V4 Flash (beste prijs-kwaliteitsverhouding) of Groq Llama (gratis quotum, snelste respons) aan.


Welke videosites werken met DualPiP ASR?

PlatformtypeOndersteunde sites
VideoYouTube, Netflix, Disney+, Bilibili, Crunchyroll, HiAnime
LerenCoursera, Udemy, TED, edX, Khan Academy
LiveTwitch, YouTube Live
VergaderingenZoom (web), Google Meet
OverigElke website met een HTML5 <video>-element

Voor video's zonder native ondertitels (zoals livestreams, nichevideo's en door gebruikers geüploade content zonder ondertiteling) is ASR de enige manier om ondertitels te krijgen. Gecombineerd met DualPiPs AI-vertaling genereer je realtime tweetalige ondertitels voor video's in elke taal — ASR genereert de originele tekst, AI vertaalt naar je doeltaal. Omdat ASR-ondertitels realtime spraakherkenning zijn, wordt AI LLM-vertaling sterk aanbevolen boven traditionele machinevertaling — AI begrijpt de gesprekscontext en produceert nauwkeurigere vertalingen.


Veelgestelde vragen

V: Hoe nauwkeurig is ASR-spraakherkenning? Deepgram nova-3 bereikt een woordfoutpercentage (WER) onder 8% voor Engels. Nederlands en andere talen leveren ook uitstekende resultaten.

V: Wat gebeurt er na het verbruik van het $200 tegoed? Automatische overgang naar betaling per gebruik. Nova-3 kost $0,007/minuut. Je kunt ook overschakelen naar lokale Whisper — volledig gratis.

V: Kunnen ASR-ondertitels en traditionele ondertitels tegelijk worden getoond? Nee. DualPiP behandelt ze als wederzijds exclusief.

V: Is ASR gratis of Premium? ASR live ondertiteling is een Premium-functie. YouTube in-page tweetalige ondertitels en de basis PiP-speler zijn gratis.

V: Welke hardware heb ik nodig voor een lokale Whisper-backend? NVIDIA GPU met 6+ GB VRAM aanbevolen. CPU werkt ook maar is langzamer. hwdsl2/whisper-server via Docker is de eenvoudigste methode.

V: Kan het meerdere talen herkennen die in één video gemengd zijn? De meertalige modus van Deepgram detecteert en wisselt automatisch tussen talen in dezelfde audiostream.


Begin met DualPiP ASR live ondertiteling

  1. Installeer DualPiP: Chrome Web Store | Edge Add-ons
  2. Gratis Deepgram-tegoed: deepgram.com (geen creditcard)
  3. Voeg Deepgram toe in DualPiP-instellingen
  4. Open PiP-venster en activeer ASR

Met AI tweetalige vertaling en leermodus wordt elke video effectief taallesmateriaal.