
本文主题: 如何使用上书7号上书用户上书7号的使用方法(技巧)经常需要在工作中识别文字,我觉得上书7号的效果很好. 虽然使用方法很简单,但是工作量很大. 那时,注意一点技巧,工作效率仍然会提高. 我走了很多弯路,并写下来与大家分享. 我个人的表达能力有限,并且有偏差,希望海涵. 基本用法: 1.打开尚书7号,然后选择打开图像. (我可以识别的格式为bmp,tif和jpg)2.选择开始识别或按F8. 识别结果将显示在窗口的上部尚书七号请检查扫描仪,布局分析结果将显示在下部. 红线是可识别的部分,绿线是无法识别的部分. 选择输出-到指定的格式文件,然后将识别结果保存为所需格式. 识别之前需要注意的问题: 1.图像质量. 批量识别时,应首先确保要识别的图像的质量. 如果无法识别,则需要对其进行重新处理,甚至导致软件死机并浪费时间. 我自己受了很多苦. 图片的分辨率应该稍高一些,并且肉眼感觉更大,因为识别工具有点近视,并且文本和背景颜色之间的对比度不高. 一般来说,用肉眼可以清楚地看到它尚书七号请检查扫描仪,并且背景颜色是灰色或黑色会影响识别结果. 2.避免出现不规则形状(图片). 识别工具只能在执行布局分析时使用方形切割. 当图片中的文字周围出现不规则形状时,文字将无法与形状分开,并且会发生错误或无法识别.

这时,更快的方法是使用PS吸收图片附近页面的背景色,并用粗笔画出该区域,而不必注意效果,颜色差别不大,然后再次保存图片. 3.避免倾斜图像. 尚书七号还提供了自动倾斜校正和手动倾斜校正工具,但即使校正后,识别率仍然低得多. 如果是被照相的书,则可能会产生一定程度的弧度,这时,请确保银行的两端对齐. 另并重新识别. 当图像质量不是大问题时,此方法有效. 有时(尤其是拍摄的照片),文本严重失真,即使使用PS也无法调整.

您可以尝试手动划分列,并划分更多列,每列包含一行或几行文本,因此对于每列,包含的范围内的错误都相对减少,这可以提高识别度率. . 3.使用批次识别功能. 尚书七号可以一次识别大量图片. 但是,在实际应用中,不建议过多地依次识别,因此很容易在任何时候检查识别结果并及时发现要纠正的错误. 4.批量识别图像时,需要花费很多时间来保存文件. 实际上,尚书7号在识别文件的同时会在图片所在的文件夹中生成一个文本文件,名称与图片相同. 因此,如果没有特殊需要,可以保存输出. 如果识别的内容属于某个部分,则可以选择左侧的所有图像列表(ctrl + A),然后选择“输出到指定格式的文件”,然后所有当前识别的内容将保存在图片排列的顺序. 我使用的尚书7号记不住保存路径. 每次选择保存时,默认情况下都会打开程序安装目录中的“ outout”文件夹. 您不必每次都选择路径. 您可以在此处保存它,然后一起传输文件. 5.如果要将图片保留在文件中,请在输出结果时选择RTF格式,然后用word打开它,您可以以完全正确的格式查看文本和图片. 6.用书的页码命名文件是一个明智的选择. 我曾经命名内容的摘要,以为内容清晰,但是当我最终纠正错误的字符时,结果令人遗憾.

7. 当图像完全无法识别时,您可以稍微提高亮度或对比度. 有时情况只会更糟一点,对您不起作用. 8.几种类型的列. 单击列时,将按下工具栏中的相应列类型按钮. 列有几种类型: 水平列(水平文本),垂直列(垂直文本),图片,表格等. 通常,可以自动识别类型,但是在手动划分列时必须选择相应的类型以进行改进承认. 率. 上述问题与拍摄情况有关. 我相信如果您进行扫描,它将减少问题. 如果您可以打开这本书,则最好将其打开. 王(尚书7号)OCR使用方法示例1由于用户继续打电话咨询尚书7号软件的使用,我们编写了有关尚书7号软件使用方法的实际示例,以帮助用户使用. 尚书OCR软件. 其中许多是我们使用上书软件的经验. 请尝试尽可能地遵循示例. 1.请切换到扫描仪驱动程序的高级控制面板状态. 为了获得更好的OCR效果,建议用户将扫描仪驱动程序SCANWIZARD软件从最初安装的标准控制面板切换到高级控制面板状态. 切换方法如下图所示. 其次,尚书OCR7软件的第一个使用的OCR软件是MICROTEK中晶科技,它是从汉王科技购买的授权书,并向用户展示. 该软件位于扫描仪的驱动程序CD中,用户可以选择安装它.
![]()
否. OCR”软件图标,然后单击. 打开上书7号OCR的用户界面. 3.打开尚书7号OCR的“文件”选项卡下的“选择扫描仪”,然后选择相应的扫描仪驱动程序“ MICROTEK” SCANWIZARD选项. 然后选择“确定”. 4.在“文件”菜单下选择“扫描”以打开扫描仪驱动程序. 如下所示,下面的界面是扫描仪的“高级控制面板”. 5.要获得支持,请注意在SCANWIZARD软件左侧“设置”窗口中选择“图像类型”. 请选择“ RGB颜色”或“灰度”的类型,并注意扫描仪分辨率为300PPI. 6.用户完成“预览”并设置要扫描的范围后,他们可以单击“扫描”按钮,扫描仪将开始扫描. 将扫描的文件直接传递到OCR的默认目录(用于存储图像文件的默认目录是用户计算机C驱动器上SHOCR2002目录下的IMAGE目录). 扫描后,请关闭扫描仪驱动程序SCANWIZARD5. 用户可以看到要扫描的文件已传递给尚书. 档案名称为HW001.JPG. 7.请在尚书7号软件的“编辑”菜单下选择“自动倾斜校正”,并让尚书7号软件相应地旋转扫描的图像,以确保图像中的文本水平排列而不是倾斜.
由于文字过于倾斜,将影响上书软件的识别效果. 9.进行布局分析后,用户可以看到相应的文本块,并选择了相应的识别框,如下所示. 10.此时,用户应注意相应识别框的属性是否正确. 识别框分别具有四个属性,例如“水平列”,“垂直列”,“表格”和“图像”,并由四个不同的颜色复选框表示. 11.检查后,用户可以使用“识别”菜单下的“开始识别”按钮. 得到的结果如下: 12.此时,实际上已经进入了文本校对状态: 13.当用户完成校对或者不在上书7号校对时,用户可以选择“至指定的格式文件”,如下所示,“用户可以看到识别结果为TXT,RTF,HTML,XLS. 可以选择其他格式. 默认的输出目录是SHOCR2002目录下的OUTPUT目录. 用户计算机的C盘,用户选择相应的文件名即可保存磁盘,为方便起见,用户可以选择“输出到外部编辑器”. 保存文件时,尚书7号OCR会自动调用相应的编辑例如,TXT保存可以自动调用NOTEPAD软件,RTF保存可以自动调用WORD软件,XLS保存可以自动调用EXCEL软件,一个简单的OCR操作现已完成.
3. 普通文档(仅包含文本)的OCR处理与上述相同,但是用户需要注意保存格式. 2.通常,如果用户需要重新输入文本,请选择TXT保存,然后将内容复制到WORD. 如果用户想保留原稿的原始格式并可以恢复版面,请使用RTF格式保存,该格式具有版面恢复功能. 但是,用户只能对其中的文本进行一些单独的单词调整,而不能进行的布局修改. 4.带表格的手稿的OCR但是,在注意“布局分析”之后,检查结果. 它应该在桌子上. 布局分析之后,会有一个蓝色框,并且已选择表格部分. 如果不是,则用户需要修改列属性或考虑手动描绘识别区域. 注意输出结果的选择. 应将其保存为TXT和XLS格式,然后分别将TXT中的文本和XLS中的表复制到WORD,以进行排版以及神奇的图片和文本识别. 尚书6号的绿色版本已由Microtek在中国扫描. 仪器随附的OCR软件. 该软件可以将打印的文本文档的图片转换为相应的文本和文本,从而提供一种全新的文本输入方法. 大大提高了用户工作效率. 尚书六号软件的特点是支持彩色和灰度图像文件,TIFF,BMP JPG格式文件以及表格识别功能.
具有上述特征的上书6号极大地方便了用户的使用,并丰富了该软件的应用领域. 上书6号软件安装完成后,出现在程序组图标中的“上书6号指令”是非常详细的用户手册. 如果用户需要仔细学习,则可以打印说明. 接下来,我们主要介绍如何使用MICROTEK扫描仪的驱动程序软件SCANWIZARD 5,以及如何与上书6号OCR软件配合进行OCR识别的要点. 建议的工作步骤如下: 1.扫描图像文件. 建议直接在桌面上使用SCANWIZARD软件,注意将软件切换到高级工作模式. 原因是它允许用户在扫描仪工作时检查其分辨率. 推荐的扫描分辨率设置为300DPI,颜色模式可以是“ RGB颜色”或“灰度”. 选择“扫描到”的文件格式是TIF或JPG. 将扫描的文件保存在用户确定的目录下. 2.打开尚书6号以读取扫描的图像文件. 识别图片的预处理. 这部分工作主要包括: 倾斜校正,设置正确的识别区域. 对于倾斜校正过程,如图所示,按工具栏中的底部工具. 按下“图像倾斜校正”工具后,将出现以下对话框: 此时,按下“是”以按下按钮. 系统将对图像进行水平倾斜校正. 完成后,结果如下: 请注意,自动倾斜校正功能只能校正+ -2.8度的原始倾斜角. 如果原始倾斜角度大于2.8度,系统会建议用户重新扫描原稿以提高识别率.
如何正确设置识别区域,这是一个值得用户注意的地方: 下面的“海尔”文章实际上分为两列进行阅读,因此在设置识别区域时,我们需要注意此功能显示需要设置两个识别区域,如图所示. 对于某些文字手稿,中间有图片时,建议使用旁路方法设置识别区域,如下所示: 对于表格图片,为了识别标题栏,建议以下识别方法: 设置的特点是表部分必须完整地加框,标题用作单独的加框区域. 4.开始识别开始“识别”时,请注意识别的软件的设置值是否正确,默认值如下: 5.识别和校对完成后,有四种文件保存类型格式选择文件. 建议识别一般文本. 用户选择TXT格式. 如果是形式识别,请选择识别结果的“ CSV”格式,可以用EXCEL打开.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/ruanjian/article-188070-1.html
让美彻底放弃冷战思维除非衰退加速
Repost