linux pdf转word命令

linux pdf转word命令,第1张

在linux系统下可以通过使用特定的pdf库来实现文档格式转换,参考如下方法

import com.spire.pdf.*

public class PDFtoWord {

public static void main(String[] args) {

//加载测试文档

PdfDocument pdf = new PdfDocument("sample.pdf")

//保存为Word

pdf.saveToFile("ToWord.docx",FileFormat.DOCX)

}

}

注意这里在程序中引入了spire.pdf.jar。

对于不允许做修改的PDF文件——就是加密加了权限的PDF,首先要去除密码或者去除数字证书,推荐用PDF Password Remove,然后再按照下面的方法进行转换为word文件:

方法一:用软件PDF To Word Converter,使用之后然后有两种结果

1、转化出来的就是想要的word,这种情况最理想了;

2、转化出来的word上都是图片,需要上网找“ABBYY finereader v9”一类的文字识别软件。ABBYY finereader v9是我见过的最强大的PDF(图片格式或者是扫描件)转word的软件。它是一款OCR软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好:安装完毕之后,首先把图片上的文字识别出来,然后再对照图片把识别错误的地方改过来,这样就实现了,从JPEG文件到word的格式转换。

方法二:在线PDF转Word共有以下几个步骤:

• 点击浏览按钮选择需要转换的PDF文件。

• 输入需要转换的页码,以逗号分割开,如果转换所有的页面可以跳过这一步。

• 点击按钮上传文件,然后等着就可以了。

• 点击下载链接把做好的文件下载到本地就可以了;

方法三:用其他软件Wondershare PDFelement等处理。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/yw/7369554.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-04
下一篇2023-04-04

发表评论

登录后才能评论

评论列表(0条)

    保存