動画字幕をAIで翻訳するには?自分のAPI Keyで DeepSeek/GPT に接続する完全ガイド
Google翻訳の字幕品質が低い — AI翻訳はどれくらい良くなる?
Google翻訳やMicrosoft翻訳などの従来の機械翻訳は、動画字幕の翻訳において明確な弱点があります。文脈の理解がなく、キャラクターの口調を識別できず、固有名詞を頻繁に誤訳します。DualPiP拡張機能では、自分のAI API Key(BYOK)を使ってDeepSeek、OpenAI、Claude、Geminiなど30以上のAIサービスに接続し、動画字幕を翻訳できます。特に日本語・韓国語・ドイツ語などの言語では、従来の機械翻訳と比べて翻訳品質が大幅に向上します。
DualPiPは4種類の無料翻訳エンジン(Google、Microsoft、Yandex、Chrome内蔵AI)とAI翻訳エンジンを同時に提供し、YouTube、Netflix、Disney+、Crunchyroll、TEDなど200以上の動画サイトに対応しています。AI翻訳は実際のAPI使用量に基づく従量課金で、中間マージンなし。他の字幕拡張機能との詳細比較は 2026年おすすめChrome二言語字幕拡張機能 をご覧ください。
AI翻訳と従来の機械翻訳は字幕でどう違う?
AI翻訳(GPT、DeepSeek、Claudeなどの大規模言語モデル)とGoogle/Microsoftの機械翻訳との最大の違いは文脈理解能力です。
| 比較項目 | 従来の機械翻訳(Google/Microsoft) | AI翻訳(DeepSeek/GPT/Claude) |
|---|---|---|
| 文脈 | 一文ずつ翻訳、文脈なし | DualPiPが直近N件の字幕を文脈として送信 |
| 口調・ニュアンス | 機械的な直訳 | 会話の口調やキャラクターの関係を認識 |
| 固有名詞 | 人名・地名を頻繁に誤訳 | 作品情報と連携し固有名詞の精度を向上 |
| 敬語・省略 | 敬語体系や省略主語を頻繁に誤訳 | 敬語を理解し省略された主語を補完 |
| 料金 | 無料 | API使用量に応じた従量課金(DeepSeek 約$0.0001/字幕) |
| 速度 | 即時 | やや遅い(通常200〜500ms) |
DualPiPのAI翻訳には作品コンテキスト認識機能が統合されています。動画タイトルを自動抽出し、TMDBデータベースで作品情報(ジャンル、あらすじ、出演者など)を検索。これらを翻訳プロンプトに組み込み、AIがキャラクター名や地名などの固有名詞をより正確に翻訳できるようにします。原文と訳文を同時に表示して語学学習したい場合は、DualPiPの二言語字幕表示もご利用いただけます。
なぜDualPiPは自分のAPI Key(BYOK)方式を採用しているのか?
DualPiPはユーザーが自分のAI API Keyを設定する方式を選択しています。他のツールのようにプラットフォームがAIサービスを代理するのではありません。
| 比較項目 | BYOK(自分のKey) | プラットフォーム代理 |
|---|---|---|
| 料金 | AIサービスに直接支払い、中間マージンなし | プラットフォームが上乗せまたはサブスク料金に含む |
| プライバシー | API Keyはローカルのみ、リクエストはサービスに直送 | プラットフォームの中継サーバーを経由 |
| モデル選択 | 任意のサービス・モデルを自由に切替 | プラットフォームが統合済みのモデルのみ |
| 料金透明性 | API利用明細を直接確認可能 | サブスク料金に含まれ個別計算が困難 |
| 柔軟性 | カスタムやセルフホストのサービスをいつでも追加可能 | プラットフォームの統合スケジュール次第 |
DualPiPの翻訳リクエストはブラウザから設定したAIサービスに直接送信されます。API Keyはブラウザのローカルストレージ(chrome.storage)にのみ保存され、中間サーバーに送信されることはありません。
DualPiPはどのAI翻訳サービスに対応している?
DualPiPは30以上のAIサービスの設定テンプレートを内蔵。サービスを選択してAPI Keyを入力するだけで使用を開始できます。
クラウドAIサービス
| サービス | API種別 | 特徴 |
|---|---|---|
| OpenAI(GPT) | OpenAI | 翻訳品質が安定、GPT-4.1 mini以上に対応 |
| Anthropic(Claude) | Claude | 長文理解に優れ、自然な翻訳 |
| Google AI(Gemini) | Gemini | Googleのマルチモーダル大規模モデル |
| DeepSeek | OpenAI互換 | コスパ最高、CJK言語の翻訳品質が優秀 |
| Groq | OpenAI互換 | 推論速度が極めて高速、リアルタイム字幕に最適 |
| Mistral | OpenAI互換 | 欧州AIサービス、多言語能力が高い |
| xAI(Grok) | OpenAI互換 | Elon Musk傘下のAI |
| OpenRouter | OpenAI互換 | 統一APIで複数モデルにアクセス |
アジア太平洋クラウドAIサービス
| サービス | API種別 | 特徴 |
|---|---|---|
| Alibaba Cloud(Qwen) | OpenAI互換 | 中国主要AI、CJK翻訳に強い |
| Volcengine(Doubao) | OpenAI互換 | ByteDance傘下、レスポンスが速い |
| Zhipu(GLM) | OpenAI互換 | 清華大学系の大規模モデル |
| Moonshot(Kimi) | OpenAI互換 | 長文コンテキスト理解に強い |
| SiliconFlow | OpenAI互換 | 複数のOSSモデルを低価格で提供 |
ローカルAI(オフライン翻訳)
| ツール | 説明 |
|---|---|
| Ollama | ローカルでOSSモデルを実行(Llama、Qwen等)、完全無料でプライバシー安全 |
| LM Studio | GUIベースのローカルモデル管理ツール |
| vLLM | 高性能ローカル推論フレームワーク |
| LLaMa.cpp / Llamafile | 軽量ローカル推論 |
ローカルAI翻訳はAPI Keyが不要で、完全にローカルマシン上で動作します。プライバシーを重視する方やネットワーク環境が限られている場合に最適です。
DualPiPでAI翻訳を設定するには?
AI翻訳の設定は3ステップ:サービスの追加、モデルの追加、翻訳サービスの選択。
ステップ1:AIサービスを追加
- DualPiP拡張機能の設定ページを開く(拡張機能アイコン → 設定)
- 翻訳サービスタブに移動
- サービス追加ボタンをクリック
- プリセットリストからサービスを選択(例:DeepSeek)、またはCustomを選択
- API Keyを入力(サービスの公式サイトから取得)
- 保存をクリック
ステップ2:モデルを追加
- 追加したサービスの下にあるモデル追加をクリック
- モデルIDを入力(例:
deepseek-v4-flash、gpt-4.1-mini、claude-haiku-4-5) - モデル思考機能をオフにすることを推奨(字幕翻訳は推論不要 — オフにすると速くて安価に)
- 保存をクリック
ステップ3:翻訳サービスを選択
ピクチャーインピクチャープレーヤーまたはページ内字幕の翻訳メニューで、追加したAIモデルを翻訳サービスとして選択。動画に字幕がない場合は、DualPiPの字幕検索機能でOpenSubtitlesなどから字幕を検索して読み込み、AI翻訳を適用できます。
字幕翻訳に最適なAIモデルは?
AIモデルの選択は翻訳品質、レスポンス速度、料金のバランスです。字幕翻訳シーンでのおすすめ:
| おすすめ度 | モデル | 1字幕あたりの料金 | 適した場面 |
|---|---|---|---|
| コスパ最強 | DeepSeek V4 Flash | ≈ $0.0001 | 日常的な視聴、CJK言語の翻訳 |
| 速度重視 | Groq Llama 4 Scout | 無料枠あり | リアルタイム字幕、低レイテンシ |
| 品質重視 | Claude Sonnet 4.6 | ≈ $0.002 | 文学的なコンテンツ、専門用語が多い作品 |
| 無料ローカル | Ollama + Llama 3.1 8B | 無料 | プライバシー優先、ローカルGPUあり |
| バランス型 | GPT-4.1 mini | ≈ $0.0003 | 汎用、安定した翻訳品質 |
字幕は短いテキスト(1字幕あたり10〜50語程度)なので、AI翻訳の実際のコストは極めて低いです。DeepSeek V4 Flashの場合、2時間の映画(約1,500〜2,000字幕)の翻訳コストは約$0.03〜0.07。DualPiPのバッチ翻訳やプロンプトキャッシュ機能でさらにコスト削減できます。
DualPiPのAI翻訳にはどんな高度な機能がある?
コンテキスト対応翻訳履歴
DualPiPはスライディングウィンドウコンテキストメカニズムを採用。最近翻訳した字幕を会話履歴としてAIに送信し、前後の文脈を理解させます。コンテキストサイズはサービス設定で調整可能(デフォルト5件、最大20件)。
作品メタデータ連携
動画タイトルを自動抽出し、TMDBデータベースで作品の詳細情報(ジャンル、あらすじ、出演者など)を検索。この情報を翻訳プロンプトに含め、キャラクター名や地名などの固有名詞の翻訳精度を向上させます。
カスタムAPIパラメータ
各サービスでカスタムリクエストヘッダーとボディパラメータ(ドット記法のネストキーに対応)を設定可能。例えばDeepSeekでthinking.type: disabledを設定して思考モードをオフにできます。
日次使用量統計と制限
サービスごとに日次のリクエスト数とToken使用量の上限を設定可能。予想外のコスト発生を防止。制限に達すると自動的に翻訳を停止し、ピクチャーインピクチャーウィンドウに通知を表示します。
モデル思考の無効化
字幕翻訳は短いテキスト翻訳タスクであり、深い推論は不要です。DualPiPではモデルごとに「思考」機能を個別に切替可能。無効にすると翻訳速度が向上し、Token消費量が減少します。
ローカルAI(Ollama)で字幕翻訳するには何が必要?
ローカルAI翻訳はAPI Key不要で、完全にローカルマシン上で動作します。プライバシーを重視する方やインターネット接続が制限されている場合に最適です。
最低要件:
- 8GB以上のRAM
- 専用GPU推奨(NVIDIA 6GB以上のVRAM) — CPUでも動作しますが低速
- Ollamaをインストールし翻訳モデルをダウンロード
おすすめモデル:
llama3.1:8b:Meta Llama 3.1 8B、多言語翻訳のバランスが良いqwen3:8b:Alibaba Qwen3 8B、日本語・中国語・韓国語の翻訳に優秀gemma3:4b:Googleの軽量モデル、4Bパラメータでも字幕翻訳に対応
設定手順:
- Ollamaをインストールして起動(デフォルトで
localhost:11434をリッスン) - ターミナルで
ollama pull llama3.1:8bを実行してモデルをダウンロード - DualPiPでOllamaサービスを追加(プリセット設定がアドレスを自動入力)
- モデルID(例:
llama3.1:8b)を追加 - そのモデルを翻訳サービスとして選択
よくある質問
Q:AI字幕翻訳は遅い? ほとんどのクラウドAIサービスのレスポンスは200〜500ms。DualPiPは字幕の先読み機能(後続の字幕を事前にバッチ翻訳)に対応しており、視聴中にほとんど遅延を感じません。
Q:API Keyは安全?サーバーにアップロードされる? API Keyはブラウザのローカルストレージ(chrome.storage)にのみ保存されます。翻訳リクエストはブラウザからAIサービスに直接送信され、中間サーバーを経由しません。
Q:GPT-4.1 miniで映画1本を翻訳するとどれくらいかかる? GPT-4.1 miniの料金は$0.40/M入力token、$1.60/M出力token。2時間の映画は約1,500〜2,000字幕。DualPiPのバッチ翻訳モードで約$0.05〜0.15。DeepSeek V4 Flash($0.14/M入力、$0.28/M出力)なら同じ映画で$0.03〜0.07です。
Q:無料翻訳とAI翻訳を併用できる? はい。DualPiPの4種類の無料翻訳エンジンとAI翻訳エンジンはいつでも切替可能。日常的には無料エンジンを使い、翻訳品質に不満がある場面でAIに切り替えるのがおすすめ。DualPiPの学習モードを使えば、ABループで字幕を1文ずつリスニング練習することもできます。
Q:対応している動画サイトは? DualPiPはYouTube、Netflix、Disney+、Crunchyroll、HiAnime、TED、Coursera、Udemyなど200以上のサイトに対応。video.js、JW Player、Plyrなどの一般的なプレーヤーフレームワークを使用するサイトも自動対応します。
Q:ローカルOllamaとクラウドAIの翻訳品質の差は? 8Bパラメータのローカルモデル(Llama 3.1 8Bなど)はGPT-4.1 miniに近い品質で、一般的な言語の字幕翻訳には十分。70B以上のパラメータのローカルモデルなら、トップクラスのクラウドモデルに匹敵します。
AI字幕翻訳を今すぐ体験
YouTubeのページ内二言語字幕と基本的なピクチャーインピクチャー再生は無料。Premiumで全サイト字幕対応、AI翻訳エンジン設定、完全な学習モードなどの機能がアンロックされます。