首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈程序员必看

    java 图片识别 tess4j_JAVA使用Tess4J进行ocr识别

    Tess4J是对Tesseract OCR API.的Java JNA 封装。使java能够通过调用Tess4J的API来使用Tesseract OCR。 TIFF,JPEG,GIF,PNG,BMP,JPEG,and PDF Tesseract 的github地址:https://github.com/tesseract-ocr/tesseract Tess4J 的github地址:https://github.com/nguyenq/tess4j Tess4J API 提供的功能: 1、直接识别支持的文件 2、识别图片流 3、识别图片的某块区域 4、将识别结果保存为 TEXT/ HOCR/ PDF/ UNLV/ BOX 5、通过设置取词的等级,提取识别出来的文字 6、获得每一个识别区域的具体坐标范围 7、调整倾斜的图片 8、裁剪图片 9、调整图片分辨率 10、从粘贴板获得图像 12、图片转换为二进制、黑白图像、灰度图像 13、反转图片颜色 demo.java: /** * Test of doOCR method, of class Tesseract. * 根据图片文件进行识别

    3.6K10编辑于 2022-09-05
  • 来自专栏四楼没电梯

    java验证码识别--4

    java验证码识别--1 http://blog.csdn.net/problc/article/details/5794460 java验证码识别--2 http://blog.csdn.net/problc 4 http://blog.csdn.net/problc/article/details/5846614 java验证码识别--5 http://blog.csdn.net/problc/article 完整eclipse工程http://download.csdn.net/detail/problc/3829004 验证码识别如果识别率都是100%,那验证码也就没存在的必要了。 其实很多验证码能达到10%的识别率就不错了。 下面来一个稍微复杂一点的,识别率85%左右。 识别结果 啥也不说了,贴代码 public class ImagePreProcess4 { private static Map<BufferedImage, String> trainMap =

    35010编辑于 2024-10-12
  • 来自专栏自然语言处理

    实体识别(4) -基于Bert进行商品标题实体识别

    基于Bert进行实体识别任务微调 所需要的pip包 pandas numpy sklearn pytorch transformers: https://github.com/ import cuda device = 'cuda' if cuda.is_available() else 'cpu' print(device) cuda 数据处理 比赛数据下载地址:商品标题实体识别 I-4,I-4,I-4,B-4,I-4,I-4,B-29,I-29,I-29,I-29,I-29,I-29,B-9,I-9,B-5,I-5,B-40,I-40,B-4,I-4,B-40,I-40,B-5 I-4,I-4,B-14,I-14,B-5,I-5,B-4,I-... , 'I-4', 'I-4', 'B-14', 'I-8', 'B-5', 'I-5', 'B-4', 'I-4', 'B-7', 'I-7', 'B-4', 'I-4', 'I-4', 'B-11',

    1.1K30编辑于 2023-08-25
  • 来自专栏想到什么就分享

    Maix Bit 系列心得(4)--- 人脸识别

    通过 kflash_gui 烧录人脸识别模型至 FLASH,Maix Bit 开发板上芯片K210跑人脸识别脚本,实现人脸识别。 一、实现步骤 具体操作步骤:MaixPy实现人脸识别 二、心得体会 刚开始以为只要把 key_gen_v1.2.bin 烧录进去,然后就可以跑脚本了。 MaixHub AIoT模型平台 模型是 KFPKG 文件,利用 kflash_gui 烧录至 Maix Bit ,然后在 MaixPy IDE 运行 MaixPy 人脸识别脚本就可以了。 a = img.draw_circle(re[0], re[1], 4) a = img.draw_circle(nose[0], nose[1], 4 ) a = img.draw_circle(lm[0], lm[1], 4) a = img.draw_circle(rm[0], rm[1], 4) #

    1.1K30发布于 2021-08-05
  • 来自专栏全栈程序员必看

    图像文字识别(四):java调用tess4j识别图像文字

    Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。 Tess4J在英文和数字识别中性能比较好,但是在中文识别中,无论速度还是识别率还是较弱,因此需要针对场景进行训练,才能获得较好结果。 这篇博客简单记录一下在java中通过调用tess4j的方式识别图片的文字内容。 ,需要指定识别语种,并且需要将对应的语言包放进项目中 instance.setLanguage("chi_sim"); // 指定识别图片 : 可以看到,tess4j在中文识别时,无论速度还是识别率还是较弱,需要针对场景进行训练,才能获得较好结果。

    6.4K40编辑于 2022-06-29
  • 来自专栏AIoT技术交流、分享

    Python+OpenCV实现AI人脸识别身份认证系统(4)—人脸识别

    本篇博文是Python+OpenCV实现AI人脸识别身份认证系统的收官之作,在人脸识别原理到数据采集、存储和训练识别模型基础上,实现人脸识别,废话少说,上效果图: ? 案例引入 在Python+OpenCV实现AI人脸识别身份认证系统(3)——训练人脸识别模型中主要讲述神经网络模型的训练过程,使用OpenCV模块中的LBPH(LOCAL BINARY PATTERNS HISTOGRAMS)人脸识别器算法(cv2.face.LBPHFaceRecogni zer_create()方法实现),训练生成“.yml”后缀的模型文件。 人脸识别的过程也非常简单,通过使用OpenCV模块读取“.yml”后缀的识别模型文件,实现人脸识别。 示例代码如下所示:

    4.2K30发布于 2021-01-20
  • 来自专栏全栈程序员必看

    tess4j验证码识别

    tess4j的安装和使用 参考:https://www.cnblogs.com/cmyxn/p/6993422.html tess4j提高识别率 1.对称近邻均值滤波 参考:http://blog.csdn.net 如只需要识别数字,则指定whitelist为0123456789即可。 也可在程序中指定: 参考http://blog.csdn.net/hellousb2010/article/details/39477859 3.尽量指定图像的一块区域识别。 比如验证码起始位置和结束位置很多空白的,可以去掉,只对验证码区域做识别4.训练字库,提升识别率 http://blog.csdn.net/white0blue/article/details/47972405 http://blog.csdn.net/tuling_research

    1.3K10编辑于 2022-07-01
  • 来自专栏全栈程序员必看

    基于Tess4j的图片识别

    Tess4J是对Tesseract OCR API的Java JNA 封装。 通过强大的API从图片中识别和提取文本内容。Tess4J支持主流的图片格式,如TIFF,JPEG,GIF,PNG,BMP,and PDF。 OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程 – https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j –> <dependency> <groupId >net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>4.3.1</version

    2.1K40编辑于 2022-08-31
  • 来自专栏全栈程序员必看

    tess4j3.2.1识别中英文

    Tesseract(); // JNA Interface Mapping //设置datapath instance.setDatapath("C:\\wangl\\soft\\tess4j StringBuilder(bytes.length * 3); for (int b : bytes) { b &= 0xff; sb.append(HEXDIGITS[b >> 4] CertificateException { this.chain = chain; tm.checkServerTrusted(chain, authType); } } } 4. https需要在代码1中指定证书文件. 5.图片信息为: 汉字验证码–demo分享 最终结果显示: 汉字验证码汴demo分享 OK,识别率还可以,但存在提升的空间! 6.如果追求高识别率,可以考虑付费的国外泰比和国内的汉王.

    1.7K20编辑于 2022-09-06
  • 来自专栏AIGC 先锋科技

    VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度!

    然而,由于传感器分辨率的限制,目前用于4D点云识别的方法存在局限性,导致缺乏详细信息。 传统4D点云网络的识别失败案例显示在图1的右侧。作者发现,4D点云的识别失败是由于动作之间的小差异造成的。当一个人用肢体执行特定动作时,参与的肢体和被操纵的物体对于区分动作至关重要。 在VG4D的基础上,作者将VLM在视频理解方面的卓越能力与4D点云表示相结合,以增强多模态动作识别。 作者的贡献可以总结如下: 作者提出了一种新颖的VG4D框架,该框架将4D特征空间与语言-图像表征对齐,有助于点云视频识别。 作者将VLMs的鲁棒特性表征能力与4D网络在点云视频理解方面的卓越能力相结合,以增强多模态动作识别。 作者提出的VG4D在大型RGB+D动作识别数据集上,显著优于近期最先进的方法。

    97910编辑于 2024-07-08
  • 来自专栏全栈程序员必看

    验证码识别(Tess4J初体验)

    遇到一道机试题 当时就懵逼了0.0查了好多资料,大体知道了基本的步骤:1.预处理 2.灰度化 3.二值化 4.去噪 5.分割 6.识别 还好题目要求不严格,可以使用开源程序。 package net.sourceforge.tess4j.example; import java.io.File; import net.sourceforge.tess4j.*; public (TesseractException e) { System.err.println(e.getMessage()); } } } 我稍微改了一下,识别指定文件夹下所有验证码 net.sourceforge.tess4j.Tesseract; import net.sourceforge.tess4j.TesseractException; /** * 验证码识别(图片名即为验证码数字 file.toString().substring(file.toString().lastIndexOf("\\")+1); System.out.println("图片名:" + fileName +" 识别结果

    1.2K20编辑于 2022-08-12
  • 来自专栏全栈程序员必看

    Java 使用 Tess4J 实现图像识别

    最近需要用Java做一个图像识别的东西,查了一些资料,在此写一个基于Tess4J的教程,方便其他人参考和使用。 其实做图像识别,也可以使用TESSERACT-OCR来实现,但是该方式需要下载软件,在电脑上安装环境,移植性不高,使用Tess4J只需要下载相关Jar包,导入项目,再把项目封装好就可以处处运行了。 首先,下载Tess4J的相关资源(一个压缩包),官网:http://tess4j.sourceforge.net/codesample.html。 Tess4J的代码比较简洁,如下: Tess4JTest.java package ocr; import net.sourceforge.tess4j.ITesseract; import net.sourceforge.tess4j.Tesseract java.io.File; import java.io.IOException; /** * Tess4J测试类 */ public class Tess4JTest { public

    2.6K10编辑于 2022-07-01
  • 来自专栏小锋学长生活大爆炸

    4步实现树莓派人脸识别、拍照与推送

    url, data=json.dumps(data)) errmsg = html.json()['errmsg'] print(">> 发送 => "+errmsg) # 人脸识别并截图 (这里是主要入口函数) def faces_video(): """人脸识别并截图(这里是主要入口函数)""" # LED init GPIO.setwarnings(False destroyWindow('frame') # 删除窗口 if __name__ == '__main__': faces_video() print(">> 完成") 4

    1.9K10发布于 2021-01-05
  • 来自专栏Y大宽

    4️⃣ 核酸序列特征分析(1):开放阅读框识别

    也就是内含子序列5'端起始的两个核苷酸总是GU,3'端最后两个核苷酸总是AG,即5'-GU......AG3,这可协助识别ORF ORF预测的工具很多,一般基于以下两种算法, 第一,基于统计学分析和模式分析

    3.3K30发布于 2019-01-28
  • 来自专栏贾志刚-OpenCV学堂

    OpenCV4人脸识别详解与代码演示

    ,从128维到024维都有可能,获取特征之后识别分为两种模型,一种是1:1称为验证,另外一种1:N称为鉴别。 整个流程图示如下: OpenCV4.5.4发布中包含了一个新的人脸识别算法支持,算法来自北邮邓伟洪教授团队贡献,SFace模型大小为37MB,属于轻量级的人脸识别模型,输出特征维度是128维。 该模型采用一种新损失功能,如下所示: SFace的损失函数通过在超球面流形上增加类内和类间约束以增大类间距离而减小类内距离,从而提升模型稳定性与泛化性能,实现更高精度的人脸识别。 ,封装成了一个人脸检测与识别的通用类,支持人脸注册、检测、识别、FPS显示功能。 从注册到识别演示如下: 选择视频,开始识别(可以看到识别结果跟注册的一致): 本人基于QT5 + OpenCV4.8开发完成了OpenCV人脸检测与识别,支持移植到乌班图系统,代码演示如下:

    38710编辑于 2026-04-02
  • 来自专栏全栈程序员必看

    JAVA——Tess4J简单的图像识别DEMO

    Tesseract 4添加了一个新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式进行工作。 Tess4J:Tesseract OCR API的 Java JNA包装器。 如只需要识别数字,则指定whitelist为0123456789即可。 比如验证码起始位置和结束位置很多空白的,可以去掉,只对验证码区域做识别4.训练字库,提升识别率 参考: http://blog.csdn.net/white0blue/article/details/47972405 http://blog.csdn.net/tuling_research

    2.5K10编辑于 2022-09-05
  • 来自专栏目标检测和深度学习

    全球最全计算机视觉资料(4:分割和识别

    目标检测和深度学习 Segmentation Alexander Kolesnikov, Christoph Lampert, Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image Segmentation, ECCV, 2016. [http://pub.ist.ac.at/~akolesnikov/files/ECCV2016/main.pdf] [https://github.com/kolesman/SEC]

    54510发布于 2018-07-20
  • 来自专栏全栈程序员必看

    JAVA使用Tess4J进行ocr识别,并切换中文

    一、电脑中安装 tesseract ;可以参考另一篇文章: Mac上安装 tesseract_MR.骑士道-CSDN博客_mac tesseract 二、下载 tess4j Download Tess4J /lib 下的所有jar包 和 tess4j/dist/tess4j-3.4.8.jar 五、编写测试代码 package com.tess4jdemo; import java.io.File ; import java.io.IOException; import net.sourceforge.tess4j.ITesseract; import net.sourceforge.tess4j.Tesseract System.currentTimeMillis(); System.out.println("执行时间:" + (endTime - startTime)); } } 六、运行查看效果 6.1、原图片 6.2、识别效果 七、汉化 7.1、发现左上角仅有的几个汉字没有识别成功;接下来我们要下载汉化包: https://raw.githubusercontent.com/tesseract-ocr/tessdata/master

    4.2K20编辑于 2022-09-07
  • 来自专栏OneTS安全团队

    RC4算法的使用及逆向中的识别技巧

    RC4流密码 RC4流密码 可魔改的地方有两处:s盒初始化时候,模可以不是256,另外可以在解密或者加密的地方再多异或一个值。 01、代码案例及原理 ⚫基本原理 RC4 主要包含三个流程: 初始化 S 和 T 数组。 初始化置换 S。 生成密钥流。 ⚫C代码案例: /******************************************************/ /* 描述:C版本RC4算法 /* 日期:2021/8/9 /* 作者: ; int enc_len = strlen((const char *)enc); rc4_init(s, key, strlen((const char *)key)); rc4_crypt 关注公众号了解其它加密算法的使用及识别技巧

    49410编辑于 2025-02-07
  • 来自专栏逆向与安全

    一张A4纸攻破某AI人脸识别产品

    一、人脸识别简介与应用场景 1.1、什么是人脸识别 人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。 1.2、人脸识别发展历程 早在20世纪50年代,认知科学家就已着手对人脸识别展开研究。 20世纪60年代,人脸识别工程化应用研究正式开启。 图3-4 四、攻击流程分析 4.1、攻击方案尝试 第一次尝试是在手机中打开一张静态照片来模拟攻击,AI能识别出图片中的人脸,但是被检测出不是真人,“人脸验证失败”,结果如图4-1所示: ?              4.2、攻击方案实施 4.2.1、模型初始化流程分析 打开摄像头,画出人脸识别框 if(v4_5 ! 上面分析活体检测时得到的活体特征,再根据YUV420数据格式将其构造到数据体中,得到一张人眼无法观看只有机器能识别的图像数据,如图4-44-5所示: ?             

    2.1K20发布于 2021-08-05
领券