建筑物评估法律依据:有什么软件能将扫描后的文件转换成word文件

来源:百度文库 编辑:杭州交通信息网 时间:2024/05/04 05:26:20
因为扫描后的文件是图片格式,如果转换成word,编辑后就方便了
我同事曾用过这种软件,可惜忘了名称

尚书七号ocr 已注册版
本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
●识别字符
简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。
简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
●识别字体种类
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
●识别字号
初号 小六号字体。
●表格识别
可以自动判断、拆分、识别和还原各种通用型印刷体表格。

●可支持繁体WINDOWS系统
一定要使用迅雷下载
http://www.d3down.com/down.asp?id=1124&no=2

已经测试过了,可以下载,速度很快

清华紫光 OCR支持Windows环境下的GB、BIG5、JIS和Shift-JIS等多种内码。在印刷体汉字识别中还加入了MMX优化技术,使识别速度得到了很大提高。我们用它识别一页A4大小的印刷体中英文混排的纯文本文件,只用了几秒钟。而且识别率非常高,只有极个别的字出现了差错。在这个版本中新增了表格识别功能。选择了识别表格的选项后,它会自动将表格的框线先识别出来,再对表格中的文字进行识别。文字全部识别出来之后会将文字按原样恢复到表格中。在这项测试中识别率也很不错。但是在测试中我们的工程师发现,当文字与表格的框线距离较近时,它的识别效果就没有那么理想了。如果用户想对一个图文混排的文件进行识别,则清华紫光 OCR还具有版面自动分析功能。它自动对扫描的版面进行分析,把应识别的文字区域划分出来,之后进行识别。对于被划分区域内的文字有很高的识别率,而且速度同样很快。不过遗憾的是,在这个版本中没有提供版面自动恢复的功能,因此如果想把文件恢复成原来的版面,则还需要重新手动排版。它的导出功能可以将带有表格的文当导出成为RTF格式的文件,从而允许用户在Word等应用程序中继续进行编辑。它还可以将扫描进来的图像格式转换成TIFF、BMP或PCZ等格式,具有很大的灵活性。它的批量识别功能可以让用户一次把多页文稿全部扫描之后再进行识别,避免了扫描一页识别一页带来的麻烦。这一版本最多可实现10000页的批量识别。该版本还增加了一项非常实用的功能,就是手写体的识别。有了这一功能,许多以前手写的信件或文件就可以扫描到计算机中,识别出来后用电子文档的方式进行保存了。不过目前的手写体识别功能还不够完全成熟,它对书写有很高的要求,如每个字之间要有一定的间隔,不能有连笔的情况等。尽管如此,手写体识别这一功能还是能够在一定程度上减轻文字录入工作的负担。该OCR还具有自学习功能,当遇到有生僻字时,可以通过键盘输入进行学习。有了这一功能,用户就可以自由地添加一些本来不“认识”的字,大大拓宽了中文OCR系统的识别字符集。清华紫光这一款专业版的OCR软件,不仅可以对纯文本文件进行识别,而且可以进行复杂的图文混排和图表文档的识别,最大限度地把人们从繁杂的文字再录入的工作中解脱出来。
http://www.msnit.net/soft.asp?id=6564

我用尚书文字识别系统很好用.把文字扫描后,存成txt格式,再用Word文档打开编辑非常方便,免除大量录入文字的辛苦.不过,识别后的文字还是有差别啦.五号字的不行,四号字的文稿还可以.

告诉你个不幸的消息,目前为止还没有办法可以解决.
再赠送你个好消息,你可以以此课题把研究进行下去,说不定可以发财哦!!!

用ORC这个软件

是啊,我也像知道。