您的位置:首页 >综合经验 >正文

赛酷ocr

摘要 关于Mini0cr软件 本软件是飞涛软件工作室开发的一款免费0cr软件,主要用于识别图像文件之中,出现的汉字显示字体。0cr的中文含意是光学字...

关于Mini0cr软件 本软件是飞涛软件工作室开发的一款免费0cr软件,主要用于识别图像文件之中,出现的汉字显示字体。0cr的中文含意是光学字符识别。为什么叫Mini呢?因为现有的识别汉字的商业0cr软件,动 二三十兆,而本软件解压后,也不过三兆多,身材比较纤小,再加上本软件主要用于识别字体比较小的汉字,所以叫Mini,中文的发音是“迷你“中文含义是超小型。既然有了商业0cr软件,为什么还要开发这个软件? 不同于商业0cr软件,本软件是免费的,可以自由使用。第二个不同之处,本软件的识别对象是屏幕出现的“显示汉字“而不是针对扫描仪扫出来的“打印汉字”。二者有什么不同呢?最重要的一点: 扫描出来的打印汉字的高度和宽度一般都在30多个像素点之 上,这是我用画图软件,打开某个商业0cr的s 1ess 1e)tif,然后一点一点数出 ’来的。从文件名和目录名的中文含意可以看出,这个点数应该是一个典型值。那么,如果用商业0cr识别屏幕上出现的小五号字,汉字的高度是12个像素点,会出现什么情况呢? 测试方法:用记事本随便写几行汉字,设置字体为小五号字。这大概是看着还算舒服的最小号的汉字字体了(高度是12个像素点),如果再小,字体就很难看了。然后,按拷屏键PrtSc,把屏幕的图像拷贝、粘贴到画图软件中,修剪尺寸后,保存为b 的格式。然后,我找了两个国内最著名的0cr软件进行测试,结果让人大吃一惊,识别率几乎为零.把图像放大两倍,再测试,结果仍然很不理想,大概也只有百分之二三十的样子。开发Mini0cr软件的由来我在开发护花使者反黄图像识别软件的时候,遇到有些图像里,嵌有某些文字,如果能把文字识别出来,图像的含义就很容易让计算机理解了。预算有限,我连扫描仪都舍不得买,就更别想买商业0cr的开发包了,大概几十万,或者更多,或者别人压根就不卖。况且它们的识别率对小字体几乎为零,不符合我的要求。

版权声明:本文由用户上传,如有侵权请联系删除!