首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pytesseract无法识别“%3”

Pytesseract无法识别“%3”
EN

Stack Overflow用户
提问于 2021-05-18 22:56:07
回答 1查看 28关注 0票数 0
代码语言:javascript
复制
from PIL import Image
import pytesseract, time, PADBS
pytesseract.pytesseract.tesseract_cmd = r"C:/tesseract/Tesseract-OCR/tesseract.exe"

image = Image.open('3.png')
print(pytesseract.image_to_string(image))

Image with '3' Image with '10'

当尝试读取“3.png”时,它结束时没有输出。但是当尝试读取'10.png‘时,它成功地读取了它。我尝试过在不同的配置上运行它;--oem3 -psm 13。我尝试过--oem1到3。但都不起作用。它无法识别此数字的可能原因是什么?我可以在代码中进行哪些更改才能使其正常工作?

EN

回答 1

Stack Overflow用户

发布于 2021-05-21 04:14:21

我想您错过了页面分割模式6

6假定有一个统一的文本块。Source

对于版本4.1.1,结果将为3。

代码:

代码语言:javascript
复制
import cv2
import pytesseract

# Load the image
img = cv2.imread("3.png")

# Convert to the gray-scale
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# OCR
txt = pytesseract.image_to_string(gry, config="--psm 6")

# Print
print(pytesseract.get_tesseract_version())
print(txt)

# Display
cv2.imshow("", gry)
cv2.waitKey(0)

Result

代码语言:javascript
复制
4.1.1
3
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67588782

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档