发布网友 发布时间:2022-02-23 00:09
共1个回答
热心网友 时间:2022-02-23 01:39
如果之前是Word文档转换PDF的,则可以用Adobe Acrodat转回Word。 但如果PDF格式是由JPG或其他形式文件转换来的,则要转换成Word且保留原有版面和格式,目前来说没有一种软件可以实现。 JPG文字一般都是用文字识别软件来实现的,这个Office本身也有自带的组件,OCR 1、 首选要确认你的OFFICE软件已经装了Microsoft Office Document Image Writer组件。可以在WORD或EXCEL下从点文件——打印——在打机印名称里找是否有Microsoft Office Document Image Writer这个虚拟打印机。确认你的OFFICE有Microsoft Office Document Image Writer组件,那就可以接着操作下一步了。 2、 用Adobe Reader 打开PDF文件,点文件——打印——打印机选Microsoft Office Document Image Writer,确定后导出文件扩展名为mdi(注:此为虚拟打印机,所以不会实体打印) 3、 用Microsoft Office Document Image Writer打开该mdi后缀的文件(其实从Adobe Reader点虚拟打印后,就会自动用Microsoft Office Document Image Writer打开该mdi文件,然后在打开的文件中点工具——使用OCR识别文本。然后再点工具——将文本发送到WORD,选择好保存路径后点确认,就生成了一个WORD文档。 由于从PDF格式转换过来的文本很多由于源文体为图片,因此是通过OCR来识别汉字的,所以有以下缺陷 1、 识别时可能出现错识,如图片文本不清、字体糊涂、字体潦草、版面背景太花、版面复杂等都会造成识别不了。 2、 识别保存后的文本是无编辑的,也就是说之前PDF文件为已经编辑好的版面需要自动重新动手编辑。