2024年4月2日发(作者:)
用
JaVa
从
DOC
和
DOCX
格式的
Word
文档中提取图片
的文档格式因为存储格式不一样,所以需
要用不通的方法提取图片。
DOCX
格式的文档实际上是压缩
文件,用程序提取图片相对实际上只需要对文章进行解压
缩,然后到指定文件夹找到图片即可。
DOe
文档则需要把图
片数据读出来,再生成文件。下面代码均可直接运行。
从
DoCX
文件中提取图片的代码:
;
DOC
和
DOCX
importjava
・
io,BufferedInputStream;
edOutputStream;
1e;
1eOutputStream;
ation;
ry;
1e;
pub1icc1assImgExt4Docx{
∕**
* @paramargs*/
staticfina1int
BUFFER
=2048;
pub1icstaticvoidmain(String[]args){
String
”D:/WOrk/”
;
String
,,
inputFi1ename =
UnZipPathname =
D√work∕unZipDir∕";
ImgExt4Docxied=newImgExt4Docx();
n(ocx(inputFi1ename
j
Un
ZipPathname));
)
∕*
* returnthefo1doftheimages
* /
pub1icStringunZipDocx(Stringdocxfi1e,Stringdes
tDir)
try{
StringinputFi1ename=docxfi1e;


发布评论