将扫描的word文件图片转换成word文档
我们在平时制作课件的过程中,为了减轻对大段文本伏案敲字的艰辛,常常要将扫描的或者翻拍的书本中的大量页面保存成图片,然后将这些文字图片转换成word文档以备课件制作调用。当然对于图片转文本,现在有很多的OCR识别软件可以做到,识别率也不低,常见的识别软件有如尚书六号、七号、汉王ocr等。那么除了专业ocr识别软件,我们还有没有更简单的方法可以完成识别?
经过长期探索,我们发现有,而且强烈推荐大家使用这款工具,那就是Office 2003 中有一个名为 Microsoft Office Document Imaging 的工具。用数码相机把文档拍摄下来,然后用这个工具OCR图片中的字符,并直接发送至 Word 中,识别率达98%以上。
只是这款软件要求的图片格式为‘TIFF’格式,需要事先把数码相机拍摄的 JPG 格式图片转换一下,当然,这也是很方便的。
操作步骤如下:
1.将扫描的文本图片保存成tiff格式。或者将翻拍的图片通过photoshop软件另存为tiff格式的文件。
2.打开Microsoft Office Document Imaging 的工具。如图1所示。
经过长期探索,我们发现有,而且强烈推荐大家使用这款工具,那就是Office 2003 中有一个名为 Microsoft Office Document Imaging 的工具。用数码相机把文档拍摄下来,然后用这个工具OCR图片中的字符,并直接发送至 Word 中,识别率达98%以上。
只是这款软件要求的图片格式为‘TIFF’格式,需要事先把数码相机拍摄的 JPG 格式图片转换一下,当然,这也是很方便的。
操作步骤如下:
1.将扫描的文本图片保存成tiff格式。或者将翻拍的图片通过photoshop软件另存为tiff格式的文件。
2.打开Microsoft Office Document Imaging 的工具。如图1所示。
图1
3.在弹出的“Microsoft Office Document Imaging”窗口中,打开要转换的tiff文件,如图2所示。 图2 打开要转换的tiff文件
4.执行菜单栏的“工具”——“使用OCR识别文本”,或者点击工具栏中的“使用OCR识别文本”图标执行识别任务,弹出如图3所示的窗口。 图3 OCR识别进程
5.识别完后,执行菜单栏“工具”——“将文本发送到word”,或者点击工具栏图标,弹出如图4所示的窗口。 图4 将文本发送到word
6.在此窗口中设置好word文档保存的文件夹后“确认”,即可弹出转换好的word文档,如图5所示。接下来就可以进行校对了。