推荐三款PDF开源神器:Stirling-PDF、OCRmyPDF 与 Marker

1.Stirling-PDF,29.8Kstar!

这是一个强劲的、本地托管的、基于 Web 的 PDF 操作工具,使用 Docker。它使您能够对 PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等。这个本地托管的 Web 应用程序已经发展到包含一套全面的功能,可以满足您的所有 PDF 要求。

Stirling PDF 不会出于记录保存或跟踪目的发起任何出站呼叫。

所有文件和 PDF 要么仅存在于客户端,要么仅在任务执行期间驻留在服务器内存中,要么仅临时驻留在文件中以执行任务。届时,用户下载的任何文件都将从服务器中删除。

GitHub地址:
https://github.com/Stirling-Tools/Stirling-PDF

推荐三款PDF开源神器:Stirling-PDF、OCRmyPDF 与 Marker

2.OCRmyPDF,12.8Kstar!

OCRmyPDF 为扫描的 PDF 文件添加 OCR 文本图层,允许对其进行搜索

主要特点

  • 从常规 PDF 生成可搜索的 PDF/A 文件
  • 将 OCR 文本准确地放置在图像下方,以便于复制/粘贴
  • 保持原始嵌入图像的准确分辨率
  • 如果可能,在不中断任何其他内容的情况下,将 OCR 信息作为“无损”操作插入
  • 优化 PDF 图像,通常生成的文件比输入文件小
  • 如果需要,在执行 OCR 之前纠偏和/或清理图像
  • 验证输入和输出文件

GitHub地址:
https://github.com/ocrmypdf/OCRmyPDF

3.Marker,14.1Kstar!

Marker 可以快速准确地将 PDF 转换为 Markdown。

  • 支持各种文档(针对书籍和科学论文进行了优化)
  • 支持所有语言
  • 删除页眉/页脚/其他工件
  • 设置表格和代码块的格式
  • 提取并保存图像以及 Markdown
  • 将大多数方程转换为乳胶
  • 适用于 GPU、CPU 或 MPS

推荐三款PDF开源神器:Stirling-PDF、OCRmyPDF 与 Marker

GitHub地址:
https://github.com/VikParuchuri/marker

#AI开源项目推荐##github##AI技术##PDF开源神器

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
爱笑的头像 - 宋马社区
评论 共2条

请登录后发表评论