Java 将HTML转为Word

本文以Java代码为例介绍如何实现将HTML文件转为Word文档(.docx、.doc)。在实际开发场景中可参考此方法来转换。下面详细方法及步骤。

在编辑代码前,请先在程序中导入Spire.Doc.jar,导入方法如下:

方法1:将Free Spire.Doc for Java包下载到本地,解压,找到lib文件夹下的Spire.Doc.jar文件。然后在IDEA中打开“Project Structure”界面,然后执行如图步骤来手动导入本地路径下的jar文件:

方法2:通过Maven仓库下载导入,如下配置pom.xml:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <name>e-iceblue</name>
            <url>//repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>5.2.0</version>
    </dependency>
</dependencies>

完成导入后,执行如下代码来转换:

Java

import com.spire.doc.*;
import com.spire.doc.documents.XHTMLValidationType;

public class HTMLtoWord {
    public static void main(String[] args) {
        //加载html文件
        Document doc = new Document();
        doc.loadFromFile("F:\\IDEAProject\\Conversion_Doc\\暴雨避险指南.html", FileFormat.Html, XHTMLValidationType.None);

        //保存为Word格式到指定路径
        doc.saveToFile("htmltoWord.docx",FileFormat.Docx_2013);
    }
}

 

★ 相关阅读推荐:Java 将Word转为HTML

 

—END—