使用 TESS4J 的光学字符识别 (OCR)

一则或许对你有用的小广告

欢迎加入小哈的星球 ,你将获得:专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡/ 赠书活动

目前, 星球 内第2个项目《仿小红书(微服务架构)》正在更新中。第1个项目:全栈前后端分离博客项目已经完结,演示地址:http://116.62.199.48/。采用技术栈 Spring Boot + Mybatis Plus + Vue 3.x + Vite 4手把手,前端 + 后端全栈开发,从 0 到 1 讲解每个功能点开发步骤,1v1 答疑,陪伴式直到项目上线,目前已更新了 255 小节,累计 39w+ 字,讲解图:1716 张,还在持续爆肝中,后续还会上新更多项目,目标是将 Java 领域典型的项目都整上,如秒杀系统、在线商城、IM 即时通讯、权限管理等等,已有 1300+ 小伙伴加入,欢迎点击围观

Tess4j 基于 JNA 的 Tesseract OCR DLL 包装器,该库提供光学字符识别 (OCR) 支持:

  • TIFF、JPEG、GIF、PNG 和 BMP 图像格式
  • 多页 TIFF 图像
  • PDF文档格式

如何运行示例

第 1 步:从 此处 下载 Maven 项目

第 2 步:运行示例

添加 VM 参数

64位

-Djna.library.path=${workspace_loc:/ocr-tess4j-example}/dlls/x64

32位

-Djna.library.path=${workspace_loc:/ocr-tess4j-example}/dlls/x86

第三步:输出