当前位置:   article > 正文

python清洗文本非法字符_Python 文本字符串清理

python 从文本中移除gbk非法字符

文本字符串清理

由于收集来源的问题(比如,表单文本数据录入错误,甚至于有意录入错误的数据),文本字符串往往需要先进行清理才能够在后续的需求中发挥正常且正确的作用。

删除字符串中多余的字符

在文本字符串中,经常会遇到开头,结尾或者中间不需要的字符,例如空白符。

strip()、lstrip()、rstrip()

strip() 方法用于移除开始或结尾的字符。该方法接受一个参数 chars,该参数为指定要移除的字符。若缺省或为 None,默认指定移除空白符。

lstrip(),rstrip() 方法参数同 strip(),lstrip() 从左执行移除操作,而 rstrip() 从右执行移除操作。

举例说明三者的用法及效果:

>>> # 空白符的移除

... s = ' hello world \n'

>>> s.strip() # 移除前后空白符

'hello world'

>>> s.lstrip() # 移除前空白符

'hello world \n'

>>> s.rstrip() # 移除后空白符

' hello world'

>>>

>>> # 指定其他字符的移除

... s = 'www.example.com'

>>> s.strip('cmowz.')

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/909506
推荐阅读
相关标签
  

闽ICP备14008679号