返回文章列表
guide··Rabbitpair

Chrome 视频字幕怎么用 AI 翻译?自带 API Key 接入 DeepSeek/GPT 完整教程

#AI翻译#双语字幕#Chrome扩展#DeepSeek#BYOK#画中画#视频学习

传统机翻字幕质量差,AI 翻译能好多少?

传统机器翻译(Google、Microsoft)在视频字幕场景下存在明显短板:缺少上下文理解、无法识别角色对话语气、人名地名经常翻错。DualPiP 扩展支持用户使用自己的 AI API Key(BYOK)接入 DeepSeek、OpenAI、Claude、Gemini 等 30+ AI 服务商翻译视频字幕,翻译质量尤其在日语、韩语、德语等语种上显著优于传统机翻。

DualPiP 同时提供 4 种免费翻译引擎(Google、Microsoft、Yandex、Chrome 内置 AI)和 AI 翻译引擎,支持 200+ 视频网站,包括 YouTube、Netflix、Disney+、Bilibili、Crunchyroll、TED 等。AI 翻译按实际 API 用量付费,无中间商加价。关于 DualPiP 与沉浸式翻译、Trancy 等扩展的完整对比,参见 2026 最好的 Chrome 双语字幕扩展推荐


AI 翻译字幕和传统机翻有什么区别?

AI 翻译(GPT、DeepSeek、Claude 等大语言模型)与 Google/Microsoft 等传统机器翻译的核心区别在于上下文理解能力

对比维度传统机翻(Google/Microsoft)AI 翻译(DeepSeek/GPT/Claude)
上下文逐句翻译,无上下文DualPiP 发送最近 N 条字幕作为上下文
语气语境机械直译能识别对话语气、角色关系
专业术语频繁翻错人名、地名结合影片信息提升专有名词翻译
日语/韩语敬语和省略常翻错理解敬语体系、补全省略主语
费用免费按 API 用量计费(DeepSeek 约 ¥0.0005/条)
速度即时略慢(通常 200-500ms)

DualPiP 的 AI 翻译还集成了影片上下文识别功能:自动提取视频标题,并通过 TMDB 数据库匹配影片信息(类型、简介、演员等),将这些信息注入翻译提示词中,帮助 AI 更准确地翻译专有名词和情节相关内容。如果你需要同时显示原文和译文进行语言学习,DualPiP 也支持中英双语字幕显示


为什么 DualPiP 采用自带 API Key(BYOK)而非内置 AI 翻译?

DualPiP 选择让用户自行配置 AI API Key,而不是像沉浸式翻译等工具那样由平台代理 AI 服务。这个设计决策基于以下考量:

对比维度BYOK(自带 Key)平台代理
费用直接向 AI 服务商付费,无中间加价平台加价或打包进订阅费
隐私API Key 仅存本地,请求直连服务商需经平台中转服务器
模型选择自由切换任何服务商和模型受限于平台已集成的模型
费用透明API 账单清晰可查包含在订阅费中,难以单独计算
合规性国内用户可选国内服务商(阿里云、火山引擎等)取决于平台部署区域

DualPiP 的翻译请求从浏览器直接发送到你配置的 AI 服务商,不经过任何中间服务器。API Key 仅存储在浏览器本地的 chrome.storage 中。你可以随时添加、删除或更换服务商,不受平台限制。


DualPiP 支持哪些 AI 翻译服务商?

DualPiP 预置了 30+ AI 服务商的配置模板,用户选择服务商后只需填入 API Key 即可开始使用。支持的服务商分为三类:

国际云端 AI 服务商

服务商API 类型特点
OpenAI(GPT)OpenAI翻译质量稳定,支持 GPT-4o 等
Anthropic(Claude)Claude擅长长文本理解,翻译自然流畅
Google AI(Gemini)GeminiGoogle 的大模型,支持多模态
DeepSeekOpenAI 兼容性价比极高,中文翻译质量优秀
GroqOpenAI 兼容推理速度极快,适合实时字幕
MistralOpenAI 兼容欧洲 AI 服务商,多语言能力强
xAI(Grok)OpenAI 兼容Elon Musk 旗下 AI
OpenRouterOpenAI 兼容统一接口访问多种模型

国内云端 AI 服务商

服务商API 类型特点
阿里云(通义千问)OpenAI 兼容国内主流,中文能力强
火山引擎(豆包)OpenAI 兼容字节跳动旗下,响应快
智谱(GLM)OpenAI 兼容清华系大模型
月之暗面(Kimi)OpenAI 兼容长文本理解能力强
硅基流动OpenAI 兼容支持多种开源模型,价格低
腾讯云OpenAI 兼容腾讯混元大模型
MiniMaxOpenAI 兼容国内 AI 创业公司

本地 AI(离线翻译)

工具说明
Ollama本地运行开源模型(Llama、Qwen 等),完全免费、隐私安全
LM Studio本地模型管理工具,图形化界面
vLLM高性能本地推理框架
LLaMa.cpp / Llamafile轻量级本地推理

本地 AI 翻译无需 API Key,完全在本机运行,适合对隐私有要求或网络不便的场景。


如何在 DualPiP 中配置 AI 翻译?

配置 AI 翻译只需三步:添加服务商、添加模型、选择翻译服务。

第一步:添加 AI 服务商

  1. 打开 DualPiP 扩展的设置页面(点击扩展图标 → 设置)
  2. 进入翻译服务标签页
  3. 点击添加服务商按钮
  4. 从预置列表中选择服务商(如 DeepSeek),或选择 Custom 自定义
  5. 填入你的 API Key(从服务商官网获取)
  6. 点击保存

第二步:添加模型

  1. 在已添加的服务商下方点击添加模型
  2. 输入模型 ID(如 deepseek-v4-flashgpt-4.1-miniclaude-haiku-4-5
  3. 建议关闭模型思考功能(字幕翻译不需要推理思考,关闭后更快更省费用)
  4. 点击保存

第三步:选择翻译服务

画中画播放器或网页内字幕的翻译菜单中,选择你刚刚添加的 AI 模型作为翻译服务即可。如果视频没有自带字幕,你还可以通过 DualPiP 的字幕搜索功能从 OpenSubtitles 等平台在线搜索加载字幕,再使用 AI 翻译。


推荐使用哪个 AI 模型翻译字幕?

选择 AI 模型需要平衡翻译质量、响应速度和费用。以下是针对字幕翻译场景的推荐:

推荐等级模型每条字幕约费用适合场景
性价比之选DeepSeek V4 Flash≈ ¥0.0005日常观影,中日韩翻译
速度优先Groq Llama 4 Scout免费额度实时字幕,需要快速响应
质量优先Claude Sonnet 4.6≈ ¥0.015文学性强的内容、专业术语多
免费本地Ollama + Qwen3免费隐私优先,有本地 GPU
均衡选择GPT-4.1 mini≈ ¥0.002通用场景,翻译质量稳定

字幕翻译的文本通常很短(每条 10-50 字),AI 翻译的实际费用极低。以 DeepSeek V4 Flash 为例,翻译一部 2 小时电影(约 1500-2000 条字幕)的费用约 ¥0.2-0.5,DualPiP 的批量翻译和缓存命中机制可进一步降低成本。


DualPiP 的 AI 翻译有哪些高级功能?

上下文历史翻译

DualPiP 使用滑动窗口上下文机制,将最近翻译的字幕作为历史消息一起发送给 AI。这让 AI 能理解前后文语境,避免出现前后不一致的翻译。上下文大小可在服务商设置中调整(默认 5 条,最多 20 条)。

影片信息增强

DualPiP 自动提取当前视频标题,并通过 TMDB 数据库查找影片详细信息(类型、简介、主演等)。这些信息会作为翻译提示词的一部分发送给 AI,帮助其正确翻译角色名、地名等专有名词。

自定义 API 参数

每个服务商支持配置自定义请求头和请求参数(支持点号分隔的嵌套键),满足不同 API 的特殊要求。例如为 DeepSeek 配置 thinking.type: disabled 关闭思考模式。

每日用量统计与限额

可以为每个服务商设置每日请求次数和 Token 用量限制,防止意外超额消费。扩展会在本地统计使用量,触发限额时自动停止翻译并在画中画窗口显示提示。

禁用模型思考

字幕翻译是简短的文本翻译任务,不需要 AI 进行深度推理。DualPiP 支持为每个模型单独开关"思考"功能,关闭后翻译速度更快、Token 消耗更少。


用本地 AI(Ollama)翻译字幕需要什么配置?

使用本地 AI 翻译不需要 API Key,完全在本机运行,适合注重隐私或无法访问海外 API 的用户。

最低配置要求

  • 8GB 以上内存
  • 推荐配备独立显卡(NVIDIA 6GB+ 显存),CPU 推理也可运行但速度较慢
  • 安装 Ollama 并下载翻译模型

推荐模型

  • qwen3:8b:通义千问 3 8B,中文翻译能力强
  • llama3.1:8b:Meta Llama 3.1,多语言翻译均衡
  • gemma3:4b:Google 轻量模型,4B 参数也能胜任字幕翻译

配置步骤

  1. 安装并启动 Ollama(默认监听 localhost:11434
  2. 在终端运行 ollama pull qwen3:8b 下载模型
  3. 在 DualPiP 中添加 Ollama 服务商(预置配置会自动填入地址)
  4. 添加模型 ID(如 qwen3:8b
  5. 选择该模型作为翻译服务

常见问题

Q:AI 翻译字幕会很慢吗? 大部分云端 AI 服务商的响应时间在 200-500ms,DualPiP 支持字幕预加载(提前批量翻译后续字幕),观看时几乎感觉不到延迟。

Q:API Key 安全吗?会被上传到服务器吗? API Key 仅存储在浏览器本地(chrome.storage),翻译请求从浏览器直接发送到 AI 服务商,不经过任何中间服务器。

Q:DeepSeek 翻译一部电影大概要花多少钱? 以 DeepSeek V4 Flash(¥1/百万输入tokens、¥2/百万输出tokens)为例,一部 2 小时电影约 1500-2000 条字幕,使用 DualPiP 批量翻译模式费用约 ¥0.2-0.5。如果系统提示词命中缓存(¥0.02/百万tokens),实际费用更低。DeepSeek 新注册用户赠送免费额度,足够翻译数十部电影。

Q:可以同时使用免费翻译和 AI 翻译吗? 可以。DualPiP 的 4 种免费翻译引擎和 AI 翻译引擎可随时切换。建议日常使用免费引擎,遇到翻译质量不满意的内容时切换到 AI。配合 DualPiP 的学习模式,还可以 AB 循环复读单句字幕进行精听训练。

Q:支持哪些视频网站? DualPiP 支持 200+ 视频网站,包括 YouTube、Netflix、Disney+、Bilibili、Crunchyroll、HiAnime、TED、Coursera、Udemy 等。基于通用播放器框架(video.js、JW Player、Plyr 等)的网站也可自动适配。

Q:本地 Ollama 翻译和云端 AI 翻译质量差多少? 8B 参数的本地模型(如 Qwen3 8B)翻译质量接近 GPT-4.1 mini,对于常见语种的字幕翻译完全够用。70B 以上参数的本地模型可以媲美顶级云端模型。


立即体验 AI 字幕翻译

YouTube 网页内双语字幕和基础画中画播放器免费使用。Premium 版解锁全平台字幕支持、AI 翻译引擎配置、完整学习模式等功能。