
尚书七号是一款专门为识别文字而研发的软件,尚书七号是应用OCR技术,为满足书籍、报刊杂志、报盘、公文档案等录入需求,实现系统管理方式而设计的软件系统。尚书七号OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的软件,适用于个人、小型图书馆、小型档案馆、小型企业进行文档输入、图书翻印、大量资料电子化的软件系统。
简繁字集:除了简体汉字外,还可以混识繁体字5400多个以及香港繁体字和GBK汉字。
识别字体种类:能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
识别字号 初号 小六号字体。
表格识别 可以自动判断、拆分、识别和还原各种通用型印刷体表格。
可支持繁体WINDOWS系统

直接运行程序setup.exe,根据安装向导的提示,就可以完成安装操作。
1、打开尚书七号,选择打开图象。(我用的版本可以识别的格式有bmp、tif、jpg)
2、选择开始识别或按F8。识别结果将显示在窗口上部,下部显示版面分析结果。其中红线为可识别部分,绿线为不可识别。尚书七号ocr 软件
3、选择输出--到指定格式文件,将识别结果保存为需要的格式。
步骤1:获取文字图像文件。尚书七号ocr 软件
选择“文件”菜单下的“扫描”或“打开图像”(将已经扫描好的图像文件打开)命令,打开图像文件。如果连接了多台扫描仪,可以选择“文件”菜单下的“选择扫描仪”命令,调用扫描仪。

步骤2:对扫描的图像页进行调整
步骤3:版面分析与文字识别转化
版面分析,选择识别范围,在进行文字识别前要选择识别范围,识别过程的核心是“版面分析”。尚书七号的自动版面分析功能很强,对报纸杂志等复杂的版面,也能保持很高的分析正确率。
设置好后,直接点击“开始识别”的按钮就可以进行文字识别了。
步骤4:校对修改
自动识别完毕,识别结果的“文本窗口”会弹出,这个窗口能够提供识别结果的校对,为了校对方便,尚书七号增加了光标跟随显示原图像行的校对方法(如图3出现的提示行的出现)。
步骤5:输出
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/tongxinshuyu/article-44272-1.html
有实战意义