2024年4月2日发(作者:)

JaVa

DOC

DOCX

格式的

Word

文档中提取图片

的文档格式因为存储格式不一样,所以需

要用不通的方法提取图片。

DOCX

格式的文档实际上是压缩

文件,用程序提取图片相对实际上只需要对文章进行解压

缩,然后到指定文件夹找到图片即可。

DOe

文档则需要把图

片数据读出来,再生成文件。下面代码均可直接运行。

DoCX

文件中提取图片的代码:

;

DOC

DOCX

importjava

io,BufferedInputStream;

edOutputStream;

1e;

1eOutputStream;

ation;

ry;

1e;

pub1icc1assImgExt4Docx{

∕**

* @paramargs*/

staticfina1int

BUFFER

=2048;

pub1icstaticvoidmain(String[]args){

String

”D:/WOrk/”

String

,,

inputFi1ename =

UnZipPathname =

D√work∕unZipDir∕";

ImgExt4Docxied=newImgExt4Docx();

n(ocx(inputFi1ename

j

Un

ZipPathname));

)

∕*

* returnthefo1doftheimages

* /

pub1icStringunZipDocx(Stringdocxfi1e,Stringdes

tDir)

try{

StringinputFi1ename=docxfi1e;