当前位置:   article > 正文

vs+qt5.0 使用poppler-qt5 操作库获取pdf所有文本输出到txt操作

vs+qt5.0 使用poppler-qt5 操作库获取pdf所有文本输出到txt操作

先获取poppler库,编译出lib与dll,配置好依赖环境,获取某页所有文本:

QList<QString> PDFkitEngine::GetText(int nPageNum)
{
    QList<QString> lstText;

    Poppler::Page* pPage = NULL;
    pPage = GetPage(nPageNum);
    if (pPage == nullptr)
    {
        return lstText;
    }

    QList<Poppler::TextBox* > lstTexts = pPage->textList();
    if (lstTexts.count() == 0)
    {
        return lstText;
    }

    for (int i = 0;i < lstTexts.count();i++) 
    {
        lstText.append(lstTexts.at(i)->text());
    }

    return lstText;
}

输出到txt文本:

void PDFkitEngine::outputText(const QString& strfileName, QList<QString>& vecText)
{
    QFile file(strfileName);
    if (!file.open(QIODevice::WriteOnly | QIODevice::Text | QIODevice::Append))
    {
        return;
    }

    QTextStream textStream(&file);
    for (auto& _info : vecText)
    {
        textStream << _info << endl;
    }
    
    file.close();
}
测试效果是可以将pdf文本全部读出来,并且成功的输出到文本文件,但是有点瑕疵是,pdf读出来的一行数据内容可能会分成2行或者多行,但是文本获取没有问题

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/煮酒与君饮/article/detail/809363
推荐阅读
相关标签
  

闽ICP备14008679号