当前位置:   article > 正文

NLP(自然语言处理——1)---常用的字符串和正则表达式_自然语言处理的字符有哪些

自然语言处理的字符有哪些
  1. NLP研究:(常用的一些命令)
  2. 字符串操作:
  3. 1)去掉空格及字符
  4. s='hello, world'
  5. print(s.strip())
  6. #结果hello, world!
  7. print(s.lstrip('hello,'))
  8. #结果 world
  9. print(s.rstrip('!'))
  10. #结果hello, world
  11. 2)连接字符串
  12. sstr1='syrcat'
  13. sstr2='append'
  14. sstr1+=sstr2
  15. print(sstr1)
  16. #结果是syrcatappend
  17. 3)查找字符
  18. sstr1='strarfas'
  19. sstr2='ra'
  20. npos=sstr1.index(sstr2)
  21. print(npos)
  22. #结果是2print(sstr1.split(','))
  23. (4)比较字符串
  24. sstr1='syrcat'
  25. sstr2='appen'
  26. print(cmp(sstr1,sstr2))
  27. print(cmp(sstr2,sstr2))
  28. print(cmp(sstr1,sstr1))
  29. (5)字符串的大小写转换
  30. ssty1.upper()#全部转换成大写
  31. sstr1.lower()#全部转换成小写
  32. 6)翻转字符串
  33. sstr1='asfasga'
  34. sstr1=sstr1[::-1]
  35. #结果是agsafsa
  36. (7)查找字符串
  37. sstr1='abcdefg'
  38. sstr2='cde'
  39. print(sstr1.find(sstr2))
  40. #结果是2
  41. (8)分割字符串
  42. sstr1='ab,cde,fgh,ijk'
  43. sstr2=','
  44. sstr1=sstr1[sstr1.find(sstr2)+1:]
  45. print(sstr1)
  46. #或者


python 的正则表达式


https://regexr.com/这个是一个网站可以验证所有的正则付豪(选中以后,文字会被选中为高亮模式)
.  所有的,除了换行符
\d 所有的数字
\d{3} 三个数字在一起的
\D除数学以外的所有
\s换行
\S除了换行
\w是a-z,A-Z数字和——
\W除了w的
?匹配前一个字符的一次或者0次,例如abc?结果可以是ab ,abc
*匹配前一个字符0次或者无限次
+匹配前一个字符无限次
[]单个字符


本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/365789
推荐阅读
相关标签
  

闽ICP备14008679号