1.Stirling-PDF,29.8Kstar!
这是一个强劲的、本地托管的、基于 Web 的 PDF 操作工具,使用 Docker。它使您能够对 PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等。这个本地托管的 Web 应用程序已经发展到包含一套全面的功能,可以满足您的所有 PDF 要求。
Stirling PDF 不会出于记录保存或跟踪目的发起任何出站呼叫。
所有文件和 PDF 要么仅存在于客户端,要么仅在任务执行期间驻留在服务器内存中,要么仅临时驻留在文件中以执行任务。届时,用户下载的任何文件都将从服务器中删除。
GitHub地址:
https://github.com/Stirling-Tools/Stirling-PDF
2.OCRmyPDF,12.8Kstar!
OCRmyPDF 为扫描的 PDF 文件添加 OCR 文本图层,允许对其进行搜索
主要特点
- 从常规 PDF 生成可搜索的 PDF/A 文件
- 将 OCR 文本准确地放置在图像下方,以便于复制/粘贴
- 保持原始嵌入图像的准确分辨率
- 如果可能,在不中断任何其他内容的情况下,将 OCR 信息作为“无损”操作插入
- 优化 PDF 图像,通常生成的文件比输入文件小
- 如果需要,在执行 OCR 之前纠偏和/或清理图像
- 验证输入和输出文件
GitHub地址:
https://github.com/ocrmypdf/OCRmyPDF
3.Marker,14.1Kstar!
Marker 可以快速准确地将 PDF 转换为 Markdown。
- 支持各种文档(针对书籍和科学论文进行了优化)
- 支持所有语言
- 删除页眉/页脚/其他工件
- 设置表格和代码块的格式
- 提取并保存图像以及 Markdown
- 将大多数方程转换为乳胶
- 适用于 GPU、CPU 或 MPS
GitHub地址:
https://github.com/VikParuchuri/marker
#AI开源项目推荐##github##AI技术##PDF开源神器
© 版权声明
文章版权归作者所有,未经允许请勿转载。如内容涉嫌侵权,请在本页底部联系我们处理!
THE END
- 最新
- 最热
只看作者