最近接到个比较奇特的需求,要用PHP来识别用户上传图片中的,提出出订单号、订单时间和金额。 分析了下,最主要的就是中文和数字识别,识别出来后再用正则按规则提取出内容。 直接用PHP来开发OCR识别是不现实的,没人有哪个闲工夫,利用现成的工具不香吗? 分析了几种工具: 1. 用现存的工具,比如百度阿里都有,但要钱! 2. 用OpenCV,这个倒不要钱了,但开发太复杂了! 3. 用 tesseract-ocr 来进行识别。 相对来说 tesseract-ocr 相对来说这个简单多了,这里把使用过程记录下。 1. 安装 …

2023年02月11日 0条评论 1654点热度 1人点赞 路灯 阅读全文