C#读取PDF文档文字内容
通过iTextSharp读取PDF文件内容,下载地址,下载后解压itextsharp-dll-core.zip。
只能读取英文和数字,文档中包含的汉字无法正常读取:
private string ReadPdfContent(string filepath) { try { string pdffilename = filepath; PdfReader pdfReader = new PdfReader(pdffilename); int numberOfPages = pdfReader.NumberOfPages;