2017征地果树补偿标准:我的一个pdf文件无法实现文字搜索,请问该如何解决?

来源:百度文库 编辑:杭州交通信息网 时间:2024/05/05 08:16:30
我下载了一本电子书,是pdf格式的,使用搜索功能时发觉无法完成搜索,明明文档里有的文字,用搜索工具搜索时就显示未找到。我怀疑是不是这个文档处理成了图片,阅读器无法识别其中的文字。请问如何解决?

看看那文字工具能否复制文字,如复制不了,那么这个pdf文档多半是由图片组成的,那么就无法搜索。但可以OCR(文字识别),比如cajviewer6.0(要三十多兆的那个)可以识别,但这个不能批量识别;office自带有一个工具,就是Microsoft Office Document Imaging,可以把PDF文档打印成mdi格式(选择相应的Microsoft Office Document Imaging writer打印机就可以打印成这个格式了),然后在这里面进行文字识别,可以识别整个文档。当然还有其他OCR工具,不过提前说一句,批量OCR的效果一般都不佳。没有办法,因为是图片格式的,所以的确没有办法得到更好的效果,除非作者在制做PDF的时候加上了索引,但一般也不会有这么勤快的人……