赞
踩
正则表达式(Regular Expression,RegEx)是一种高度灵活的文本处理工具,它结合了字符序列、特殊控制字符(称为元字符)、以及特定的构造规则,形成一种模式描述语言。这种模式能够精准地匹配、查找、替换或提取文本中的特定字符串或模式。正则表达式的核心价值在于其强大的模式描述能力,使得开发者能够以简洁的表达式来应对复杂的文本处理需求。
正则表达式广泛应用于多种场合,简化了字符串处理任务,主要用途包括:
示例:在log.txt
中查找含有"ERROR"关键词的行。
grep 'ERROR' log.txt
示例:查找所有以数字或小写字母开头的行。
grep '^[0-9a-z]' data.txt
[0-9a-z]
匹配数字0-9和小写字母a-z中的任意一个,^
确保匹配的是行首字符。示例:查找所有以".conf"为文件扩展名的行。
ls | grep '\.conf$'
\.
用于匹配实际的点字符,$
确保".conf"位于行尾,从而精确匹配文件扩展名。示例:查找所有以任何形式的"email"出现的行。
grep -E 'email.*' messages.log
.
匹配任意字符(除了换行符),*
表示前面的元素可以重复零次或多次,所以email.*
匹配以"email"开始的任何文本。示例:查找所有长度为6的密码。
grep -E '\b\w{6}\b' passwords.txt
\w{6}
匹配正好六个单词字符(字母、数字或下划线),\b
确保匹配的是完整单词。[]
内时失去特殊含义。[abc]
匹配"a"、"b"或"c"。cat|dog
匹配"cat"或"dog"。\d{3,5}
匹配3到5位数字。\n
引用之前分组的内容,如(\w+)\s+\1
匹配重复的单词。-i
选项,如grep -i 'error'
。-z
(如在grep中)处理多行文本作为一个整体。-n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e :直接在命令列模式上进行 sed 的动作编辑;
-f :直接将 sed 的动作写在一个文件内, -f filename 则可以运行 filename 内的 sed 动作;
-r :sed 的动作支持的是延伸型正规表示法的语法。(默认是基础正规表示法语法)
-i :直接修改读取的文件内容,而不是输出到终端。
输出符合条件的文本(p)
sed '/pattern/p' filename
pattern
的行后面直接再输出该行,相当于打印匹配到的行。删除符合条件的文本(d)
sed '/pattern/d' filename
pattern
的行。替换符合条件的文本
sed 's/old/new/g' filename
old
的字符串替换为new
,g
标志表示全局替换。迁移符合条件的文本
sed '/pattern/{h;d};G' filename
pattern
的行会被暂存(h
命令),然后删除(d
命令),接着在每个非匹配行后追加暂存的行(G
命令)。使用脚本编辑文件
script.sed
,内容为s/pattern/replacement/
,然后执行sed -f script.sed filename
。sed直接操作文件示例
sed -i 's/old/new/g' filename
-i
选项表示就地编辑。$0 表示整个当前行
$1 每行第一个字段
NF 字段数量变量
NR 每行的记录号,多文件记录递增
FNR 与NR类似,不过多文件记录不递增,每个文件都从1开始
\t 制表符
\n 换行符
FS BEGIN时定义分隔符
RS 输入的记录分隔符, 默认为换行符(即文本是按一行一行输入)
~ 匹配,与==相比不是精确比较
!~ 不匹配,不精确比较
== 等于,必须全部相等,精确比较
!= 不等于,精确比较
&& 逻辑与
|| 逻辑或
+ 匹配时表示1个或1个以上
/[0-9][0-9]+/ 两个或两个以上数字
/[0-9][0-9]*/ 一个或一个以上数字
FILENAME 文件名
OFS 输出字段分隔符, 默认也是空格,可以改为制表符等
ORS 输出的记录分隔符,默认为换行符,即处理结果也是一行一行输出到屏幕
-F'[:#/]' 定义三个分隔符
(1):按行输出文本
awk -F":" '{print}' /etc/passwd //输出所有
awk -F":" '{print $0}' /etc/passwd //输出所有
awk -F: 'NR==3,NR==6{print}' /etc/passwd //显示第3行到第6行
awk -F: 'NR>=3&&NR<=6{print}' /etc/passwd //显示第3行到第6行
awk -F: 'NR==3||NR==6{print}' /etc/passwd //显示第3行和第6行
awk '(NR%2)==1{print}' /etc/passwd //显示奇数行
awk '(NR%2)==0{print}' /etc/passwd //显示偶数行
awk '/^root/{print}' /etc/passwd //显示以root开头的行
awk '/nologin$/{print}' /etc/passwd //显示以nologin结尾的行
awk 'BEGIN {x=0};/\/bin\/bash$/{x++};END {print x}' /etc/passwd //统计以/bin/bash结尾的行数
awk 'BEGIN{RS=""};END{print NR}' /etc/ssh/sshd_config //统计以空行分隔的文本段落数
awk '{print NR,$0}' /etc/passwd //输出每行的行号
awk -F: '{print NR,NF,$NF,"\t",$0}' /etc/passwd //依次打印行号,字段数,最后字段值,制表符,每行内容
awk -F: 'NR==5{print}' /etc/passwd //显示第5行
route -n|awk 'NR!=1{print}' //不显示第一行
awk -F: '{print NF}' /etc/passwd //显示每行有多少字段
awk -F: '{print $NF}' /etc/passwd //将每行第NF个字段的值打印出来
awk -F: 'NF==4 {print }' /etc/passwd //显示只有4个字段的行
awk -F: 'NF>2{print $0}' /etc/passwd //显示每行字段数量大于2的行
(2):按字段输出文本
awk -F":" '{print $3}' /etc/passwd //显示第三列
awk -F":" '{print $1 $3}' /etc/passwd //$1与$3相连输出,无空格,
awk -F":" '{print $1,$3}' /etc/passwd //多了一个逗号,输出第1和第3个字段,有空格
awk -F: '$2=="!!" {print}' /etc/shadow //统计密码为空的shadow记录
awk 'BEGIN {FS=":"}; $2=="!!" {print}' /etc/shadow ##显示密码为空的用户的shadow信息
awk -F ":" '$7~"/bash" {print $1}' /etc/passwd ##显示第七个字段为/bash的行的第一个字段
awk -F: 'NR==5{print}' /etc/passwd //显示第5行
awk -F":" '{print $1 " " $3}' /etc/passwd //$1与$3之间手动添加空格分隔
(3):通过管道,双引号调用Shell命令
awk -F: '/bash$/{print | "wc -l"}' /etc/passwd ##统计bash用户的个数
awk 'BEGIN {while ("w" | getline) n++ ; {print n-2}}' ##统计在线用户的数量
awk 'BEGIN {"hostname" | getline;print $0}' ##输出当前主机名
awk -F: '$1~/mail/ && $3>6 {print }' /etc/passwd //逻辑与,$1匹配mail,并且$3>6
awk -F: '{if($1~/mail/ && $3>8) print }' /etc/passwd
awk -F: '$1~/mail/ || $3>1000 {print }' /etc/passwd //逻辑或,统计以mail开头或第3列大于1000的行
awk -F: '{if($1~/mail/ || $3>1000) print }' /etc/passwd
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。