写在开始
1月我向大家介绍了 PDFMathTranslate —— 一款能够完整保留原格式的超级好用的 PDF 翻译工具,同时也分享了使用国产大模型进行翻译(deepseek、通义千问)的视频。
视频发布后收到了很多问题,同时我也有了一些新的发现,因此在此将常见问题进行汇总解答,与大家共同学习交流。
需要说明的是,该软件并非由我开发,我只是一个使用者。项目地址:PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译。
第一个问题:图片、表格怎么翻译
由于图表内容若参与翻译,容易导致最终文档排版混乱,因此软件在翻译时会自动跳过图表。下面分享我个人处理图片和表格翻译的方法:
- 图片翻译:将图片中的文本复制出来进行翻译,翻译结果可用作批注。
- 表格翻译:
- 将表格截图,提交给大模型,并附上提示:“请你把这个表格翻译,并以表格/markdown代码格式输出”。
- 得到翻译后的表格后,大家可以选择截图保存,或将 markdown 代码复制到支持 markdown 格式的软件中进行进一步处理。
- 示例展示如下:
- 如果大家没有支持markdown格式的软件,那就让大模型以表格格式输出。再截图保存下来就行了
- 如果有的话复制markdown代码到软件里面就好。
第二个问题:翻译失败或翻译后仍为英文
出现翻译失败或翻译结果仍为英文的情况,多半是由于所使用的模型存在问题。建议大家不要使用测试版模型,而应优先选择稳定版模型进行翻译。
第三个问题:最多可以翻译多少页?哪个模型好?
我曾使用 deepseek-v3 成功翻译了 370 页的文档,也推荐大家优先选择 deepseek 模型,原因如下:
- 价格实惠:以我的经验,翻译 370 页只花费了约 1.55 元(其中包含 30% 的低谷优惠);而翻译 17 页大约只需 6 分钟,耗时约 10 分钟左右。
- 不限速度:与其他厂商相比,deepseek 对翻译速度没有严格限制(其他服务通常会对每分钟请求数量或最长文本长度进行限制),从而避免了翻译过程中速度变慢或中途失败的问题。
更多关于如何使用 deepseek 进行翻译,请参考:【PDFMathTranslate】使用国产大模型进行翻译---deepseek、通义千问
deepseek-v3 价格说明
模型 | deepseek-chat | |
---|---|---|
上下文长度 | 64K | |
最大输出长度 | 8K | |
标准时段价格 (北京时间 08:30-00:30) |
百万tokens输入(缓存命中)(4) | 0.5元 |
百万tokens输入(缓存未命中) | 2元 | 4元 |
百万tokens输出 (5) | 8元 | 16元 |
优惠时段价格 (北京时间 00:30-08:30) |
百万tokens输入(缓存命中) | 0.25元(5折) |
百万tokens输入(缓存未命中) | 1元(5折) | 1元(2.5折) |
百万tokens输出 | 4元(5折) | 4元(2.5折) |
第四个问题:同样的api情况下,为什么我的速度慢?
第五个问题:安装出错
在安装过程中可能会遇到问题,主要原因是程序需要下载一个 AI 模型(wybxc/DocLayout-YOLO-DocStructBench-onnx
),而在国内网络环境下往往难以顺利下载。以下提供三种解决方案:
- 使用代理:确保网络代理已开启。
- 配置环境变量使用镜像地址:
Windows 命令行:
PowerShell :set HF_ENDPOINT=https://hf-mirror.com
$env:HF_ENDPOINT = https://hf-mirror.com
- 离线安装:如果以上方法均无效,Windows 用户可前往发布页面下载
pdf2zh-version-win64.zip
,解压后直接双击pdf2zh.exe
运行。如果下载速度较慢或网页无法访问,我也将文件上传至百度网盘,大家可直接下载。
另外,请确保你的 Python 版本在 3.10 至 3.12 之间(3.10 <= 版本 <= 3.12)。
第六个问题:GUI(图形界面)中没有填写 API Key 的入口
如果在通过命令 pdf2zh -i
打开 GUI 时没有找到填写 API Key 的地方,如下图所示:
解决方法很简单:
- 关闭代理,或将代理模式调整为“规则模式”。
- 如果使用的是国外翻译服务,建议先打开 GUI,再启动代理。
第七个问题:如何自定义服务器端口
你可以使用以下命令指定服务器端口:
pdf2zh --serverport xxx
第八个问题:怎么更新最新版本
更新到最新版本的命令如下:
pip install -U pdf2zh
第九问题:是否有 Zotero 插件
插件地址:zotero-pdf2zh 本人的教程地址:轻松实现Zotero文献翻译!手把手教你配置pdf2zh插件
若还有其他未涉及的问题,欢迎大家参考:FAQ 常见问题 · Byaidu/PDFMathTranslate Wiki · GitHub
翻译很慢,14页 1M 的PDF文件翻译速度很慢是什么问题。【大模型:通义千问-Max
文本生成/32K/通义千问2.5系列千亿级别超大规模语言模型,支持中文、英文等不同语言输入。随着模型的升级,qwen-max将滚动更新升级。如果希望使用固定版本,请使用历史快照版本。】
看看翻译时间是多少,要是十几分钟还好。