使用iText以Java阅读PDF

时间:2020-01-09 10:35:36  来源:igfitidea点击:

在这篇文章中,我们将看到一个使用iText库读取PDF文档的Java程序。

使用iText阅读PDF

要使用iText阅读PDF,我们需要使用以下步骤。

  • 创建一个PDFReader实例,将其包装在PDFDocument中。
  • 获取PDF中必须阅读的页数。
  • 遍历页面并使用PdfTextExtractor提取每个页面的内容。

PDF用于阅读。

Java程序

import java.io.IOException;
import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.PdfReader;
import com.itextpdf.kernel.pdf.canvas.parser.PdfTextExtractor;

public class ReadPDF {
  public static final String READ_PDF = "F://theitroad//result//List.pdf";
  public static void main(String[] args) {
  try {
    // PDFReader
    PdfReader reader = new PdfReader(READ_PDF);
    PdfDocument pdfDoc = new PdfDocument(reader);
    // get the number of pages in PDF
    int noOfPages = pdfDoc.getNumberOfPages();
    System.out.println("Extracted content of PDF---- ");
    for(int i = 1; i <= noOfPages; i++) {
      // Extract content of each page
      String contentOfPage = PdfTextExtractor.getTextFromPage(pdfDoc.getPage(i));
      System.out.println(contentOfPage );
    }
    pdfDoc.close();
    }catch (IOException e) {
      System.out.println("Exception occurred " + e.getMessage());
    }
  }
}

输出:

Extracted content of PDF---- 
List with Roman symbols
i. Item1
ii. Item2
iii. Item3
List with English letter symbols
A. Item1
B. Item2
C. Item3
List with Greek letter symbols
α. Item1
β. Item2
γ. Item3