1、使用 Java 拆分 Word、PDF
该软件库为 Java 开发人员提供了一组功能,可将 Word、PDF、EPUB、HTML、DOCX 文档拆分为多个部分。将文本拆分为单独的文件可用于更轻松地处理文档的各个部分。文档拆分过程可以是用于将数据集成到自动化信息系统或数据库中的技术的一部分。
我们的库为 Java 开发人员提供了文档所需的所有功能,并根据指定的模式提取文档页面。这是一个独立的 Java 解决方案,不需要安装 Microsoft Word、Acrobat Reader 或其他应用程序。
2、使用 Java 将文档拆分为多个部分
在 Java 代码中使用不同的标准拆分文档内容。您可以使用以下页面提取模式:"按标题拆分"、"按节拆分"、"按页拆分"、"按页面范围拆分"。
拆分文档后,您可以使用 \'Document.Save\' 方法将结果导出为所需的文件格式。您还可以使用 \'DocumentPartSavingCallback\' 属性控制如何将文档部分导出为 HTML 或 EPUB 格式,这将允许您重定向输出流。