• 欢迎访问开心洋葱网站,在线教程,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站,欢迎加入开心洋葱 QQ群
  • 为方便开心洋葱网用户,开心洋葱官网已经开启复制功能!
  • 欢迎访问开心洋葱网站,手机也能访问哦~欢迎加入开心洋葱多维思维学习平台 QQ群
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏开心洋葱吧~~~~~~~~~~~~~!
  • 由于近期流量激增,小站的ECS没能经的起亲们的访问,本站依然没有盈利,如果各位看如果觉着文字不错,还请看官给小站打个赏~~~~~~~~~~~~~!

java PDF文件解析成String

JAVA相关 水墨上仙 2602次浏览

java PDF文件解析成String

boolean sort = false;// 是否排序
int startPage = 1;// 开始提取页数
int endPage = Integer.MAX_VALUE;// 结束提取页数
Writer output = null;// 文件输入流,生成文本文件
PDDocument document = null;// 内存中存储的PDF Document
try {
	document = PDDocument.load(file);
	ByteArrayOutputStream baos = new ByteArrayOutputStream();
	output = new OutputStreamWriter(baos);
	PDFTextStripper stripper = null;// PDFTextStripper来提取文本
	stripper = new PDFTextStripper();
	stripper.setSortByPosition(sort);// 设置是否排序
	stripper.setStartPage(startPage);// 设置起始页
	stripper.setEndPage(endPage);// 设置结束页
	// 调用PDFTextStripper的writeText提取并输出文本
	stripper.writeText(document, output);
	return baos.toString();
} catch (MalformedURLException e) {
	throw e;
} finally {
	if (output != null) {// 关闭输出流
		output.close();
	}
	if (document != null) {// 关闭PDF Document
		document.close();
	}
}


开心洋葱 , 版权所有丨如未注明 , 均为原创丨未经授权请勿修改 , 转载请注明java PDF文件解析成String
喜欢 (0)
加载中……