当前位置:   article > 正文

基于PaddleNLP的层次分类_paddle 层次分类

paddle 层次分类

本项目提供通用场景下基于PaddleNLP的层次分类端到端应用方案。层次文本分类任务的中数据样本具有多个标签且标签之间存在特定的层级结构,目标是预测输入句子/文本可能来自于不同级标签类别中的某一个或几个类别。

以下是基于pytorch的层次分类:
https://blog.csdn.net/zhanghan11366/article/details/135731399

1、代码结构

hierarchical/
├── few-shot # 小样本学习方案
├── retrieval_based # 语义索引方案
├── analysis # 分析模块
├── deploy # 部署
│   └── predictor # 离线部署
│   ├── paddle_serving # PaddleServing在线服务化部署
│   └── triton_serving # Triton在线服务化部署
├── train.py # 训练评估脚本
├── predict.py # 预测脚本
├── export_model.py # 静态图模型导出脚本
├── utils.py # 工具函数脚本
├── metric.py # metric脚本
├── prune.py # 裁剪脚本
└── README.md # 使用说明
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

2、快速开始

我们以2020语言与智能技术竞赛:事件抽取任务抽取的多标签层次数据集为例,演示层次分类全流程方案使用。下载数据集:

wget https://paddlenlp.bj.bcebos.com/datasets/baidu_extract_2020.tar.gz
tar -zxvf baidu_extract_2020.tar.gz
mv baidu_extract_2020 data
rm baidu_extract_2020.tar.gz
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

2.1 运行环境

conda create -n UTC_hierarchical python=3.7 pip=21.1.1
conda activate UTC_hierarchical
python3 -m  pip install scikit-learn==1.0.2
pip install paddlenlp==2.4.8
python -m pip install paddlepaddle-gpu==2.3.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
  • 1
  • 2
  • 3
  • 4
  • 5

2.2 数据准备

训练需要准备指定格式的标注数据集,如果没有已标注的数据集,可以参考 数

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/人工智能uu/article/detail/771500
推荐阅读
相关标签
  

闽ICP备14008679号