文章15 | 阅读 6229 | 点赞0
用itext自动生成PDF的过程中,想要在PDF中的某一页加入水印,这个水印图片的页码不固定,所以不能直接用‘sealStamperUnder = stamp.getUnderContent(page-1);’方式加入水印。但是该水印在某一固定图片的上一页,那么我们可以定位这张图片的位置信息,以此获取水印图片的页码信息。通过这种方法还可以获得图片的坐标信息。
需导入的jar包:itext-pdfa-5.5.6.jar、itext-xtra-5.5.6.jar、itext-5.5.6.jar、itext-asian.jar
/** * 返回关键字所在页码和坐标 * @param filePath PDF位置 * @param image 要定位的图片 * @return List<float[]> 返回关键字所在的坐标和页数 float[0] >> X; float[1] >> Y; float[2] >> page */
public List<float[]> getKeyWords(String filePath, final Image image) {
final List<float[]> arrays = new ArrayList<float[]>();
PdfReader pdfReader;
try {
pdfReader = new PdfReader(filePath);
int pageNum = pdfReader.getNumberOfPages();
PdfReaderContentParser pdfReaderContentParser = new PdfReaderContentParser(pdfReader);
for (int i = 1; i <= pageNum; i++) {
final int finalI = i;
pdfReaderContentParser.processContent(i, new RenderListener() {
//此方法是监听PDF里的文字内容,有重复情况会都把坐标和页码信息都存入arrays里
@Override
public void renderText(TextRenderInfo textRenderInfo) {
/*String text = textRenderInfo.getText(); // 整页内容 if (null != text && text.contains(key)) { Rectangle2D.Float boundingRectange = textRenderInfo .getBaseline().getBoundingRectange(); float[] resu = new float[3]; resu[0] = (float)boundingRectange.getCenterX(); resu[1] = (float)boundingRectange.getCenterY(); resu[2] = finalI; arrays.add(resu); }*/
}
//此方法是监听PDF里的图片内容
@Override
public void renderImage(ImageRenderInfo arg0) {
PdfImageObject image0;
try {
image0 = arg0.getImage();
byte[] imageByte = image0.getImageAsBytes();
Image imageInPDF = Image.getInstance(imageByte);
if(image0!=null && imageInPDF.equals(image)){
float[] resu = new float[3];
// 0 => x; 1 => y; 2 => z
//z的值始终为1
resu[0] = arg0.getStartPoint().get(0);
resu[1] = arg0.getStartPoint().get(1);
resu[2] = finalI;
arrays.add(resu);
}
} catch (IOException e) {
e.printStackTrace();
} catch (BadElementException e) {
e.printStackTrace();
}
}
@Override
public void endTextBlock() {
}
@Override
public void beginTextBlock() {
}
});
}
pdfReader.close();
} catch (IOException e) {
e.printStackTrace();
}
return arrays;
}
后记:此方法是获取图片的坐标与页码信息,如果想获取文本的坐标与页码信息,请把renderText()中的注释去掉,getKeyWords()的参数换一下即可。
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/sand_clock/article/details/70183329
内容来源于网络,如有侵权,请联系作者删除!