当前位置:   article > 正文

正则表达式在NLP中的基本应用_nlp为什么写正则表达式

nlp为什么写正则表达式

正则表达式在NLP中的作用

1.将非结构化文档转化为结构化文本

2.去噪

 

 

  1. #在python中使用re模块来实现正则表达式
  2. import re
  3. """text_string='组合范畴语法(Combinatory categorial grammar,),是在AB演算基础上进行扩展而产生的范畴语法。' \
  4. '从语法理论视角看,CCG是一种词汇形式化的方法。从计算语言学视角看,CCG属于一类适度上下文相关文法。' \
  5. '从逻辑语义学视角看,CCG在句法与语义的接口方面非常融洽。无论是CCG语言的、计算的,还是逻辑的特征,' \
  6. '都使得 CCG非常适用于自然语言信息处理,对于计算语言学具有很好的理论和实际价值。'
  7. #regex='CCG' 匹配含有CCG的句子
  8. #regex='C..' 匹配含有C..的句子,'.'可表示任意字符
  9. #regex='..G' 同上
  10. #regex='^从' 匹配以从开始的句子
  11. #regex='从$' 匹配以从结尾的句子
  12. regex='^从[语逻]' #匹配以 '从语'和'从逻'开始的句子 []表示后边可以匹配多个字符
  13. p_string=text_string.split('。')
  14. for line in p_string:
  15. if re.search(regex,line)is not None:
  16. print(line)"""
  17. #关于转义字符'/'的匹配
  18. """if re.search(r"\\","I love N\LP"):
  19. print("YES")
  20. else :
  21. print("NO")"""
  22. #关于抽取特殊数字或者字符
  23. years_string='2016 was good,but 2017 will be better!'
  24. year=re.findall('[2][0-9][0-9][0-9]',years_string) #字符[a-z]同理
  25. print(year)

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/421150
推荐阅读
相关标签
  

闽ICP备14008679号