当前位置:   article > 正文

PaddleNLP的应用

paddlenlp

1 介绍

PaddleNLP是一个基于PaddlePaddle框架的自然语言处理(NLP)工具库。

它提供了一系列用于文本处理、文本分类、情感分析、文本生成等任务的预训练模型、模型组件和工具函数。

PaddleNLP有统一的应用范式:通过 paddlenlp.Taskflow 调用,简捷易用。


2 安装

2.1 安装依赖包

  1. pip install python==3.8.10 -i https://mirror.baidu.com/pypi/simple
  2. pip install paddlepaddle==2.4.2 -i https://mirror.baidu.com/pypi/simple
  3. pip install paddlenlp==2.5.2 -i https://mirror.baidu.com/pypi/simple
  4. pip install opencv-python -i https://mirror.baidu.com/pypi/simple
  5. pip install paddleocr -i https://mirror.baidu.com/pypi/simple
  6. pip install --upgrade opencv-python
  7. pip install --upgrade paddlenlp
  8. pip install --upgrade paddleocr


2.2 验证是否安装成功

执行python命令,未报错则代表安装成功

  1. import paddle
  2. paddle.utils.run_check()

2.3 问题排查

(1)执行时如果报错 ModuleNotFoundError: No module named ‘paddle.nn.layer.layers‘,则再次执行以下安装命令

pip install paddlenlp==2.5.2 -i https://mirror.baidu.com/pypi/simple

3 使用

3.1 中文分词

  1. from paddlenlp import Taskflow
  2. # (1)默认模式-实体粒度分词,在精度和速度上的权衡,基于百度LAC
  3. seg = Taskflow("word_segmentation")
  4. print(seg("PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库"))
  5. # 结果:['PaddleNLP', '是', '一个', '基于', 'PaddlePaddle', '深度', '学习', '平台', '的', '自然语言处理', '工具', '库']
  6. # (2)指定模式-粗粒度分词,速度更快,基于jieba
  7. seg = Taskflow("word_segmentation", mode="fast")
  8. print(seg("PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库"))
  9. # 结果:['PaddleNLP', '是', '一个', '基于', 'PaddlePaddle', '深度', '学习', '平台', '的', '自然语言', '处理', '工具', '库']
  10. # (3)精确模式-最准:实体粒度切分准确度最高,基于百度解语
  11. seg_accurate = Taskflow("word_segmentation", mode="accurate")
  12. print(seg_accurate("PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库"))
  13. # 结果:['PaddleNLP', '是', '一个', '基于', 'Paddle', 'Paddle', '深度学习平台', '的', '自然', '语言处理工具库']
  14. # (4)批量处理——平均速度更快
  15. print(seg(["PaddleNLP是一个基于PaddlePaddle深度学习平台的自然语言处理工具库",
  16.            "它提供了一系列用于文本处理、文本分类等任务的预训练模型、模型组件和工具函数"]))
  17. # 结果:[['PaddleNLP', '是', '一个', '基于', 'PaddlePaddle', '深度', '学习', '平台', '的', '自然语言', '处理', '工具', '库'], ['它', '提供', '了', '一系列', '用于', '文本处理', '、', '文本', '分类', '等', '任务', '的', '预', '训练', '模型', '、', '模型', '组件', '和', '工具', '函数']]


4 参考文献

(1) 数据处理轻松搞定:如何利用PaddleNLP高效处理大规模文本数据
(2)ModuleNotFoundError

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/349362
推荐阅读
  

闽ICP备14008679号