当前位置:   article > 正文

中文NLP数据增强_中文nlp数据增强_nlp中文数据集增强代码csdn-csdn博客

中文nlp数据增强_nlp中文数据集增强代码csdn-csdn博客

代码

github
几个简单的NLP数据增强示例:

  • random delete word
  • random delete char
  • random delete symbol
  • random swag word
  • random back translate by google (需要能访问谷歌)
  • random synonym substitution
  • random back translate by youdao(免费,有道支持)

示例

使用单独的增强

from aug_func import func_list
import random

if __name__ == '__main__':
    sentences = "爱打篮球的男生喜欢什么样的女生"
    func = random.choice(func_list)
    print(func(sentences, prob=1.0))
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

使用全部的增强

from aug_func import func_list
import random

if __name__ == '__main__':
    sentences = "爱打篮球的男生喜欢什么样的女生"
    for func in func_list:
        sentences = func(sentences, prob=random.random())
    print(sentences)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/535540
推荐阅读
相关标签
  

闽ICP备14008679号