【PDFMathTranslate】常见问题与实用解决方案

她笑中藏泪花
3月4日发布

#BV#

若视频不清晰或者有不理解的请点蓝色字体观看原视频

写在开始

1月我向大家介绍了 PDFMathTranslate —— 一款能够完整保留原格式的超级好用的 PDF 翻译工具,同时也分享了使用国产大模型进行翻译(deepseek、通义千问)的视频。
视频发布后收到了很多问题,同时我也有了一些新的发现,因此在此将常见问题进行汇总解答,与大家共同学习交流。
需要说明的是,该软件并非由我开发,我只是一个使用者。项目地址:PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译

第一个问题:图片、表格怎么翻译

由于图表内容若参与翻译,容易导致最终文档排版混乱,因此软件在翻译时会自动跳过图表。下面分享我个人处理图片和表格翻译的方法:

  1. 图片翻译:将图片中的文本复制出来进行翻译,翻译结果可用作批注。
  2. 表格翻译
    • 将表格截图,提交给大模型,并附上提示:“请你把这个表格翻译,并以表格/markdown代码格式输出”。
    • 得到翻译后的表格后,大家可以选择截图保存,或将 markdown 代码复制到支持 markdown 格式的软件中进行进一步处理。
    • 示例展示如下:
    • image.png|450
    • 如果大家没有支持markdown格式的软件,那就让大模型以表格格式输出。再截图保存下来就行了
    • 如果有的话复制markdown代码到软件里面就好。

第二个问题:翻译失败或翻译后仍为英文

出现翻译失败或翻译结果仍为英文的情况,多半是由于所使用的模型存在问题。建议大家不要使用测试版模型,而应优先选择稳定版模型进行翻译。


第三个问题:最多可以翻译多少页?哪个模型好?

我曾使用 deepseek-v3 成功翻译了 370 页的文档,也推荐大家优先选择 deepseek 模型,原因如下:

  1. 价格实惠:以我的经验,翻译 370 页只花费了约 1.55 元(其中包含 30% 的低谷优惠);而翻译 17 页大约只需 6 分钟,耗时约 10 分钟左右。
  2. 不限速度:与其他厂商相比,deepseek 对翻译速度没有严格限制(其他服务通常会对每分钟请求数量或最长文本长度进行限制),从而避免了翻译过程中速度变慢或中途失败的问题。

更多关于如何使用 deepseek 进行翻译,请参考:【PDFMathTranslate】使用国产大模型进行翻译---deepseek、通义千问

deepseek-v3 价格说明

模型 deepseek-chat
上下文长度 64K
最大输出长度 8K
标准时段价格
(北京时间 08:30-00:30)
百万tokens输入(缓存命中)(4) 0.5元
百万tokens输入(缓存未命中) 2元 4元
百万tokens输出 (5) 8元 16元
优惠时段价格
(北京时间 00:30-08:30)
百万tokens输入(缓存命中) 0.25元(5折)
百万tokens输入(缓存未命中) 1元(5折) 1元(2.5折)
百万tokens输出 4元(5折) 4元(2.5折)

第四个问题:同样的api情况下,为什么我的速度慢?

可能和线程数有关,线程数默认是4,调成8或者12试试。 image.png

第五个问题:安装出错

在安装过程中可能会遇到问题,主要原因是程序需要下载一个 AI 模型(wybxc/DocLayout-YOLO-DocStructBench-onnx),而在国内网络环境下往往难以顺利下载。以下提供三种解决方案:

  1. 使用代理:确保网络代理已开启。
  2. 配置环境变量使用镜像地址: Windows 命令行:
    set HF_ENDPOINT=https://hf-mirror.com
    
    PowerShell :
    $env:HF_ENDPOINT = https://hf-mirror.com
    
  3. 离线安装:如果以上方法均无效,Windows 用户可前往发布页面下载 pdf2zh-version-win64.zip,解压后直接双击 pdf2zh.exe 运行。如果下载速度较慢或网页无法访问,我也将文件上传至百度网盘,大家可直接下载。

另外,请确保你的 Python 版本在 3.10 至 3.12 之间(3.10 <= 版本 <= 3.12)。


第六个问题:GUI(图形界面)中没有填写 API Key 的入口

如果在通过命令 pdf2zh -i 打开 GUI 时没有找到填写 API Key 的地方,如下图所示: image.png|500 解决方法很简单:

  • 关闭代理,或将代理模式调整为“规则模式”。
  • 如果使用的是国外翻译服务,建议先打开 GUI,再启动代理。

第七个问题:如何自定义服务器端口

你可以使用以下命令指定服务器端口:

pdf2zh --serverport xxx

第八个问题:怎么更新最新版本

更新到最新版本的命令如下:

pip install -U pdf2zh

第九问题:是否有 Zotero 插件

插件地址:zotero-pdf2zh 本人的教程地址:轻松实现Zotero文献翻译!手把手教你配置pdf2zh插件


若还有其他未涉及的问题,欢迎大家参考:FAQ 常见问题 · Byaidu/PDFMathTranslate Wiki · GitHub

© 版权声明
THE END
喜欢就支持一下吧
点赞 1 分享 收藏
评论 共2条
OωO
取消
  1. 头像
    青禾
     · 
    回复

    翻译很慢,14页 1M 的PDF文件翻译速度很慢是什么问题。【大模型:通义千问-Max
    文本生成/32K/通义千问2.5系列千亿级别超大规模语言模型,支持中文、英文等不同语言输入。随着模型的升级,qwen-max将滚动更新升级。如果希望使用固定版本,请使用历史快照版本。】

  2. 头像
     · 
    回复

    看看翻译时间是多少,要是十几分钟还好。