Chrome 视频字幕怎么用 AI 翻译?自带 API Key 接入 DeepSeek/GPT 完整教程
传统机翻字幕质量差,AI 翻译能好多少?
传统机器翻译(Google、Microsoft)在视频字幕场景下存在明显短板:缺少上下文理解、无法识别角色对话语气、人名地名经常翻错。DualPiP 扩展支持用户使用自己的 AI API Key(BYOK)接入 DeepSeek、OpenAI、Claude、Gemini 等 30+ AI 服务商翻译视频字幕,翻译质量尤其在日语、韩语、德语等语种上显著优于传统机翻。
DualPiP 同时提供 4 种免费翻译引擎(Google、Microsoft、Yandex、Chrome 内置 AI)和 AI 翻译引擎,支持 200+ 视频网站,包括 YouTube、Netflix、Disney+、Bilibili、Crunchyroll、TED 等。AI 翻译按实际 API 用量付费,无中间商加价。关于 DualPiP 与沉浸式翻译、Trancy 等扩展的完整对比,参见 2026 最好的 Chrome 双语字幕扩展推荐。
AI 翻译字幕和传统机翻有什么区别?
AI 翻译(GPT、DeepSeek、Claude 等大语言模型)与 Google/Microsoft 等传统机器翻译的核心区别在于上下文理解能力。
| 对比维度 | 传统机翻(Google/Microsoft) | AI 翻译(DeepSeek/GPT/Claude) |
|---|---|---|
| 上下文 | 逐句翻译,无上下文 | DualPiP 发送最近 N 条字幕作为上下文 |
| 语气语境 | 机械直译 | 能识别对话语气、角色关系 |
| 专业术语 | 频繁翻错人名、地名 | 结合影片信息提升专有名词翻译 |
| 日语/韩语 | 敬语和省略常翻错 | 理解敬语体系、补全省略主语 |
| 费用 | 免费 | 按 API 用量计费(DeepSeek 约 ¥0.0005/条) |
| 速度 | 即时 | 略慢(通常 200-500ms) |
DualPiP 的 AI 翻译还集成了影片上下文识别功能:自动提取视频标题,并通过 TMDB 数据库匹配影片信息(类型、简介、演员等),将这些信息注入翻译提示词中,帮助 AI 更准确地翻译专有名词和情节相关内容。如果你需要同时显示原文和译文进行语言学习,DualPiP 也支持中英双语字幕显示。
为什么 DualPiP 采用自带 API Key(BYOK)而非内置 AI 翻译?
DualPiP 选择让用户自行配置 AI API Key,而不是像沉浸式翻译等工具那样由平台代理 AI 服务。这个设计决策基于以下考量:
| 对比维度 | BYOK(自带 Key) | 平台代理 |
|---|---|---|
| 费用 | 直接向 AI 服务商付费,无中间加价 | 平台加价或打包进订阅费 |
| 隐私 | API Key 仅存本地,请求直连服务商 | 需经平台中转服务器 |
| 模型选择 | 自由切换任何服务商和模型 | 受限于平台已集成的模型 |
| 费用透明 | API 账单清晰可查 | 包含在订阅费中,难以单独计算 |
| 合规性 | 国内用户可选国内服务商(阿里云、火山引擎等) | 取决于平台部署区域 |
DualPiP 的翻译请求从浏览器直接发送到你配置的 AI 服务商,不经过任何中间服务器。API Key 仅存储在浏览器本地的 chrome.storage 中。你可以随时添加、删除或更换服务商,不受平台限制。
DualPiP 支持哪些 AI 翻译服务商?
DualPiP 预置了 30+ AI 服务商的配置模板,用户选择服务商后只需填入 API Key 即可开始使用。支持的服务商分为三类:
国际云端 AI 服务商
| 服务商 | API 类型 | 特点 |
|---|---|---|
| OpenAI(GPT) | OpenAI | 翻译质量稳定,支持 GPT-4o 等 |
| Anthropic(Claude) | Claude | 擅长长文本理解,翻译自然流畅 |
| Google AI(Gemini) | Gemini | Google 的大模型,支持多模态 |
| DeepSeek | OpenAI 兼容 | 性价比极高,中文翻译质量优秀 |
| Groq | OpenAI 兼容 | 推理速度极快,适合实时字幕 |
| Mistral | OpenAI 兼容 | 欧洲 AI 服务商,多语言能力强 |
| xAI(Grok) | OpenAI 兼容 | Elon Musk 旗下 AI |
| OpenRouter | OpenAI 兼容 | 统一接口访问多种模型 |
国内云端 AI 服务商
| 服务商 | API 类型 | 特点 |
|---|---|---|
| 阿里云(通义千问) | OpenAI 兼容 | 国内主流,中文能力强 |
| 火山引擎(豆包) | OpenAI 兼容 | 字节跳动旗下,响应快 |
| 智谱(GLM) | OpenAI 兼容 | 清华系大模型 |
| 月之暗面(Kimi) | OpenAI 兼容 | 长文本理解能力强 |
| 硅基流动 | OpenAI 兼容 | 支持多种开源模型,价格低 |
| 腾讯云 | OpenAI 兼容 | 腾讯混元大模型 |
| MiniMax | OpenAI 兼容 | 国内 AI 创业公司 |
本地 AI(离线翻译)
| 工具 | 说明 |
|---|---|
| Ollama | 本地运行开源模型(Llama、Qwen 等),完全免费、隐私安全 |
| LM Studio | 本地模型管理工具,图形化界面 |
| vLLM | 高性能本地推理框架 |
| LLaMa.cpp / Llamafile | 轻量级本地推理 |
本地 AI 翻译无需 API Key,完全在本机运行,适合对隐私有要求或网络不便的场景。
如何在 DualPiP 中配置 AI 翻译?
配置 AI 翻译只需三步:添加服务商、添加模型、选择翻译服务。
第一步:添加 AI 服务商
- 打开 DualPiP 扩展的设置页面(点击扩展图标 → 设置)
- 进入翻译服务标签页
- 点击添加服务商按钮
- 从预置列表中选择服务商(如 DeepSeek),或选择 Custom 自定义
- 填入你的 API Key(从服务商官网获取)
- 点击保存
第二步:添加模型
- 在已添加的服务商下方点击添加模型
- 输入模型 ID(如
deepseek-v4-flash、gpt-4.1-mini、claude-haiku-4-5) - 建议关闭模型思考功能(字幕翻译不需要推理思考,关闭后更快更省费用)
- 点击保存
第三步:选择翻译服务
在画中画播放器或网页内字幕的翻译菜单中,选择你刚刚添加的 AI 模型作为翻译服务即可。如果视频没有自带字幕,你还可以通过 DualPiP 的字幕搜索功能从 OpenSubtitles 等平台在线搜索加载字幕,再使用 AI 翻译。
推荐使用哪个 AI 模型翻译字幕?
选择 AI 模型需要平衡翻译质量、响应速度和费用。以下是针对字幕翻译场景的推荐:
| 推荐等级 | 模型 | 每条字幕约费用 | 适合场景 |
|---|---|---|---|
| 性价比之选 | DeepSeek V4 Flash | ≈ ¥0.0005 | 日常观影,中日韩翻译 |
| 速度优先 | Groq Llama 4 Scout | 免费额度 | 实时字幕,需要快速响应 |
| 质量优先 | Claude Sonnet 4.6 | ≈ ¥0.015 | 文学性强的内容、专业术语多 |
| 免费本地 | Ollama + Qwen3 | 免费 | 隐私优先,有本地 GPU |
| 均衡选择 | GPT-4.1 mini | ≈ ¥0.002 | 通用场景,翻译质量稳定 |
字幕翻译的文本通常很短(每条 10-50 字),AI 翻译的实际费用极低。以 DeepSeek V4 Flash 为例,翻译一部 2 小时电影(约 1500-2000 条字幕)的费用约 ¥0.2-0.5,DualPiP 的批量翻译和缓存命中机制可进一步降低成本。
DualPiP 的 AI 翻译有哪些高级功能?
上下文历史翻译
DualPiP 使用滑动窗口上下文机制,将最近翻译的字幕作为历史消息一起发送给 AI。这让 AI 能理解前后文语境,避免出现前后不一致的翻译。上下文大小可在服务商设置中调整(默认 5 条,最多 20 条)。
影片信息增强
DualPiP 自动提取当前视频标题,并通过 TMDB 数据库查找影片详细信息(类型、简介、主演等)。这些信息会作为翻译提示词的一部分发送给 AI,帮助其正确翻译角色名、地名等专有名词。
自定义 API 参数
每个服务商支持配置自定义请求头和请求参数(支持点号分隔的嵌套键),满足不同 API 的特殊要求。例如为 DeepSeek 配置 thinking.type: disabled 关闭思考模式。
每日用量统计与限额
可以为每个服务商设置每日请求次数和 Token 用量限制,防止意外超额消费。扩展会在本地统计使用量,触发限额时自动停止翻译并在画中画窗口显示提示。
禁用模型思考
字幕翻译是简短的文本翻译任务,不需要 AI 进行深度推理。DualPiP 支持为每个模型单独开关"思考"功能,关闭后翻译速度更快、Token 消耗更少。
用本地 AI(Ollama)翻译字幕需要什么配置?
使用本地 AI 翻译不需要 API Key,完全在本机运行,适合注重隐私或无法访问海外 API 的用户。
最低配置要求:
- 8GB 以上内存
- 推荐配备独立显卡(NVIDIA 6GB+ 显存),CPU 推理也可运行但速度较慢
- 安装 Ollama 并下载翻译模型
推荐模型:
qwen3:8b:通义千问 3 8B,中文翻译能力强llama3.1:8b:Meta Llama 3.1,多语言翻译均衡gemma3:4b:Google 轻量模型,4B 参数也能胜任字幕翻译
配置步骤:
- 安装并启动 Ollama(默认监听
localhost:11434) - 在终端运行
ollama pull qwen3:8b下载模型 - 在 DualPiP 中添加 Ollama 服务商(预置配置会自动填入地址)
- 添加模型 ID(如
qwen3:8b) - 选择该模型作为翻译服务
常见问题
Q:AI 翻译字幕会很慢吗? 大部分云端 AI 服务商的响应时间在 200-500ms,DualPiP 支持字幕预加载(提前批量翻译后续字幕),观看时几乎感觉不到延迟。
Q:API Key 安全吗?会被上传到服务器吗? API Key 仅存储在浏览器本地(chrome.storage),翻译请求从浏览器直接发送到 AI 服务商,不经过任何中间服务器。
Q:DeepSeek 翻译一部电影大概要花多少钱? 以 DeepSeek V4 Flash(¥1/百万输入tokens、¥2/百万输出tokens)为例,一部 2 小时电影约 1500-2000 条字幕,使用 DualPiP 批量翻译模式费用约 ¥0.2-0.5。如果系统提示词命中缓存(¥0.02/百万tokens),实际费用更低。DeepSeek 新注册用户赠送免费额度,足够翻译数十部电影。
Q:可以同时使用免费翻译和 AI 翻译吗? 可以。DualPiP 的 4 种免费翻译引擎和 AI 翻译引擎可随时切换。建议日常使用免费引擎,遇到翻译质量不满意的内容时切换到 AI。配合 DualPiP 的学习模式,还可以 AB 循环复读单句字幕进行精听训练。
Q:支持哪些视频网站? DualPiP 支持 200+ 视频网站,包括 YouTube、Netflix、Disney+、Bilibili、Crunchyroll、HiAnime、TED、Coursera、Udemy 等。基于通用播放器框架(video.js、JW Player、Plyr 等)的网站也可自动适配。
Q:本地 Ollama 翻译和云端 AI 翻译质量差多少? 8B 参数的本地模型(如 Qwen3 8B)翻译质量接近 GPT-4.1 mini,对于常见语种的字幕翻译完全够用。70B 以上参数的本地模型可以媲美顶级云端模型。
立即体验 AI 字幕翻译
YouTube 网页内双语字幕和基础画中画播放器免费使用。Premium 版解锁全平台字幕支持、AI 翻译引擎配置、完整学习模式等功能。