赞
踩
原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。
在python中为了使反斜杠和元字符取消字符的特殊功能,需要在字符前添加反斜杠。
解决的办法就是为正则表达式使用 Python 的 raw 字符串表示;在字符串前加个 “r” 反斜杠就不会被任何特殊方式处理,所以 r”\n” 就是包含”\” 和 “n” 的两个字符,而 “\n” 则是一个字符,表示一个换行。正则表达式通常在 Python 代码中都是用这种 raw 字符串表示。
原始字符串除在字符串的第一个引号前加上字母“r”(可以大小写)以外,与普通字符串有着几乎完全相同的语法。
如:
>>> '\n'
'\n'
>>> print '\n'
>>> r'\n'
'\\n'
>>> print r'\n'
\n
使用原始字符串,可以让我们减少错误。
如下例子中,打开readme.txt时出现异常,就是因为’\r’和’\t’被当成不在我们的文件名中的特殊字符。
>>> f = open("D:\windows\temp\readme.txt",'r')
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
f = open("D:\windows\temp\readme.txt",'r')
IOError: [Errno 22] invalid mode ('r') or filename: 'D:\\windows\temp\readme.txt'
所以应在文件路径前加上字母‘r’,使用原始字符串
>>> f = open(r"D:\windows\temp\readme.txt",'r')
>>> f.readline()
'Hello World!'
>>> f.close()
原始字符串的特性是我们的工作变得方便,如正则表达式的使用:
>>> import re
>>> m = re.search('\\[rtfvn]',r'hello world!\n')
>>> if m is not None : m.group()
>>> m = re.search(r'\\[rtfvn]',r'hello world!\n')
>>> if m is not None : m.group()
'\\n'
>>>
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。