重庆到长葛的火车票:关于PDF转换的问题

来源:百度文库 编辑:杭州交通信息网 时间:2024/04/18 16:30:38
,慧视小灵鼠免费下载并且能用的地址,我找了几个都不能用的。另外汉王文本王免费下载并且能用的地址?

我用PDF时遇到问题,因为本文是扫描为图片的PDF,其中的文字不能直接复制。在网上查了很多,有人说要先转成TIF,再用汉王文本王转成文字。若是比较短的就用慧视小灵鼠。但是下载的两个软件都不能使用。汉王的一打开就是未检测到扫描仪或加密狗。我都快疯了。盼哪位高手解救一下啊!!

不是这两个软件也可以。只要告诉我怎样才可以从PDF中提取文字就好了。
你们说的都是文本的,这个我可以解决

我问的是非文本的,即图片,有些PDF是将书直接扫描上来,本身就相当于一张张的图片,用SOLID等软件根本不能转换成文本,只能通过曲线转换。

我先用PDFTOTIF将它转成TIF格式,再用OCR软件解读。问题现在OCR软件下下来没一个能用的。请问是将PDF转成JPEG还是TIF格式再用OCR?另外,OCR软件哪里有可用的下载?谢谢

pdf格式的文件如何转换成Word文档(2种方法)
  1、用ScanSoft PDF Converter Pro v3.0 特别版
  http://down.chinageren.com/d/asp_php_cgi_jsp_net_soft_5595.html
  为PDF转换提供了完整的解决方案,能合并,转换,直接编辑PDF文件
  2、可以利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转WORD文档,
  也就是说利用WORD来完成该任务。方法如下:
  用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”
  栏中的名称设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
  注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除
  组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。
  然后,运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本
  发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重
  新运行OCR。这可能需要一些时间”,不管它,确认即可。
  以上仅在word2003中可用,其他版本没有Microsoft Office Document Image Writer。
  Microsoft Office 2003 with SP2 大企业版 http://down.htcnc.net/Software/Catalog33/276.html

晕 直接可以保存成TXT就可以了 PDF阅读器有这个功能

试试pdftotxt吧!
实话说,这种软件的效果都不是太好,但还可以勉强用一下!

如果是直接由文件转为PDF文件的,可以直接用ACROBAT STANAND 版本,可以直接选择文件,提取文字,如果是图片转成PDF文件,可以先用ILLUSTRATOR将文件转为图片文件,然后用OCR软件读取就可以了