当前位置:   article > 正文

python 去除非中文字符_python过滤一段文字中的非中文

python过滤一段文字中的非中文

直接上代码:

  1. import re
  2. def find_chinese(file):
  3. pattern = re.compile(r'[^\u4e00-\u9fa5]')
  4. chinese = re.sub(pattern, '', file)
  5. print(chinese)
  6. def find_unchinese(file):
  7. pattern = re.compile(r'[\u4e00-\u9fa5]')
  8. unchinese = re.sub(pattern,"",file)
  9. print(unchinese)
  10. if __name__ == "__main__":
  11. line = "2019年1月3日 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('\',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ..."
  12. print("原文:")
  13. print(line)
  14. print("保留中文:")
  15. find_chinese(line)
  16. print("保留非中文:")
  17. find_unchinese(line)
  1. 原文:
  2. 201913 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ...
  3. 保留中文:
  4. 年月日去除空格和换行符的方法一去除空格用后边的串替换掉前边的
  5. 保留非中文:
  6. 201913 - python 、 strip().strip() # ...replace('',''),posted @ 2016-07-18 08:53 ...

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/382972
推荐阅读
相关标签
  

闽ICP备14008679号