赞
踩
Linux系统中,AWK 是一个非常强大的文本处理工具,它的内置函数使得对文本数据进行处理更加高效和便捷。
本文将介绍 AWK 内置函数的几种主要类型:
- 算数函数
- 字符串函数
- 时间函数
- 位操作函数
- 其他常用函数
我们将使用一个示例文本文件来演示这些函数的用法,并提供详细的注释说明,继续分享。
基础学习,可以回头查看:Linux文本处理三剑客:awk(结构化命令)
函数名 | 功能 | 参数 | 示例 | 输出 |
atan2(y,x) | 返回正切值 y/x 的角度值,角度以弧度为单位 | y, x | atan2(10, -10) * 180 / PI | 135 |
cos(expr) | 返回 expr 的余弦值,输入参数以弧度为单位 | expr | cos(60 * PI / 180.0) | 0.5 |
exp(expr) | 返回自然数 e 的 expr 次幂 | expr | exp(5) | 148.413159 |
int(expr) | 返回数值 expr 的整数部分 | expr | int(5.12345) | 5 |
log(expr) | 计算 expr 自然对数 | expr | log(5.5) | 1.704748 |
rand | 返回一个大于等于 0 小于 1 的随机数 | - | rand() | 0.237788 |
sin(expr) | 返回角度 expr 的正弦值,角度以弧度为单位 | expr | sin(30 * PI / 180) | 0.5 |
sqrt(expr) | 计算 expr 的平方根 | expr | sqrt(1024.0) | 32 |
srand([expr]) | 使用种子值生成随机数 | expr | srand(10) | 1417959587 |
注释:
- # 反正切函数
- awk 'BEGIN {
- PI = 3.14159265
- x = -10
- y = 10
- result = atan2 (y,x) * 180 / PI;
- printf "对于 (x=%f, y=%f),反正切值为 %f 度\n", x, y, result
- }'
-
-
- # 余弦函数
- awk 'BEGIN {
- PI = 3.14159265
- param = 60
- result = cos(param * PI / 180.0);
- printf "%f 度的余弦值为 %f\n", param, result
- }'
-
-
- # 自然指数函数
- awk 'BEGIN {
- param = 5
- result = exp(param);
- printf "%f 的自然指数值为 %f\n", param, result
- }'
-
-
- # 取整函数
- awk 'BEGIN {
- param = 5.12345
- result = int(param)
- print "Truncated value =", result
- }'
-
-
-
- # 自然对数函数
- awk 'BEGIN {
- param = 5.5
- result = log (param)
- printf "log(%f) = %f\n", param, result
- }'
-
-
- # 随机数函数
- awk 'BEGIN {
- print "Random num1 =" , rand()
- print "Random num2 =" , rand()
- print "Random num3 =" , rand()
- }'
-
-
- #正弦函数
- awk 'BEGIN {
- PI = 3.14159265
- param = 30.0
- result = sin(param * PI /180)
- printf "The sine of %f degrees is %f.\n", param, result
- }'
-
-
-
- # 平方根函数
- awk 'BEGIN {
- param = 1024.0
- result = sqrt(param)
- printf "sqrt(%f) = %f\n", param, result
- }'
-
-
- # 设置随机数种子
- awk 'BEGIN {
- param = 10
- printf "srand() = %d\n", srand()
- printf "srand(%d) = %d\n", param, srand(param)
- }'
-
函数名 | 功能 | 参数 | 示例 | 输出 |
asort(arr, [d [, how]]) | 使用 GAWK 值比较的一般规则排序 arr 中的内容 | arr, d, how | asort(arr) | - |
asorti(arr, [d [, how]]) | 对数组的索引排序 | arr, d, how | asorti(arr) | - |
gsub(regexp, replacement [, target]) | 全局替换子串 | regexp, replacement, target | gsub("World", "Jerry", str) | Hello, Jerry |
index(str, sub) | 检测子串是否存在 | str, sub | index(str, subs) | 5 |
length(str) | 返回字符串长度 | str | length(str) | 16 |
match(str, regex) | 搜索与正则表达式匹配的子串 | str, regex | match(str, subs) | 5 |
split(str, arr, regex) | 分割字符串 | str, arr, regex | split(str, arr, ",") | One, Two, Three, Four |
sprintf(format, expr-list) | 按指定格式构造字符串 | format, expr-list | sprintf("%s", "Hello, World !!!") | Hello, World !!! |
strtonum(str) | 将字符串转换为数值 | str | strtonum("123") | 123 |
sub(regex, sub, string) | 执行一次子串替换 | regex, sub, string | sub("World", "Jerry", str) | Hello, Jerry |
substr(str, start, l) | 返回子串 | str, start, l | substr(str, 1, 5) | Hello |
tolower(str) | 将所有大写字母转换为小写字母 | str | tolower(str) | hello, world !!! |
toupper(str) | 将所有小写字母转换为大写字母 | str | toupper(str) | HELLO, WORLD !!! |
注释:
- # 按字母顺序排列数组元素
- $ awk 'BEGIN {
- arr[0] = "Three"
- arr[1] = "One"
- arr[2] = "Two"
- print "排序前数组元素:"
- for (i in arr) {
- print arr[i]
- }
- asort(arr)
- print "排序后数组元素:"
- for (i in arr) {
- print arr[i]
- }
- }'
-
-
-
- # 按索引顺序排列数组元素
- awk 'BEGIN {
- arr["Two"] = 1
- arr["One"] = 2
- arr["Three"] = 3
- asorti(arr)
- print "排序后数组索引:"
- for (i in arr) {
- print arr[i]
- }
- }'
-
-
- # 替换字符串
- awk 'BEGIN {
- str = "Hello, World"
- print "替换前字符串 = " str
- gsub("World", "Jerry", str)
- print "替换后字符串 = " str
- }'
-
-
- # 查找子串的位置
- awk 'BEGIN {
- str = "One Two Three"
- subs = "Two"
- ret = index(str, subs)
- printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
- }'
-
-
-
-
- # 获取字符串长度
- awk 'BEGIN {
- str = "Hello, World !!!"
- print "长度 = ", length(str)
- }'
-
-
-
- # 使用正则表达式匹配子串
- awk 'BEGIN {
- str = "One Two Three"
- subs = "Two"
- ret = match(str, subs)
- printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
- }'
-
-
-
- # 将字符串分割为数组
- awk 'BEGIN {
- str = "One,Two,Three,Four"
- split(str, arr, ",")
- print "数组包含以下元素:"
- for (i in arr) {
- print arr[i]
- }
- }'
-
-
- # 使用 sprintf() 格式化字符串
- awk 'BEGIN {
- str = sprintf("%s", "Hello, World !!!")
- print str
- }'
-
-
- # 将字符串转换为数字
- awk 'BEGIN {
- print "Decimal num = " strtonum("123")
- print "Octal num = " strtonum("0123")
- print "Hexadecimal num = " strtonum("0x123")
- }'
-
-
-
-
- # 使用 sub() 替换字符串
- awk 'BEGIN {
- str = "Hello, World"
- print "替换前字符串 = " str
- sub("World", "Jerry", str)
- print "替换后字符串 = " str
- }'
-
-
- # 获取子字符串
- awk 'BEGIN {
- str = "Hello, World !!!"
- subs = substr(str, 1, 5)
- print "Substring = " subs
- }'
-
-
- # 小写转换
- awk 'BEGIN {
- str = "HELLO, WORLD !!!"
- print "Lowercase string = " tolower(str)
- }'
-
-
-
- # 大写转换
- awk 'BEGIN {
- str = "hello, world !!!"
- print "Uppercase string = " toupper(str)
- }'
-
函数名 | 功能 | 参数 | 示例 | 输出 |
systime | 返回从 Epoch 以来到当前时间的秒数 | - | systime() | 1418574432 |
mktime(datespec) | 将字符串转换为时间戳 | datespec | mktime("2014 12 14 30 20 10") | 1418604610 |
strftime([format [, timestamp[, utc-flag]]]) | 格式化时间戳 | format, timestamp, utc-flag | strftime("Time = %m/%d/%Y %H:%M:%S", systime()) | Time = 12/14/2014 22:08:42 |
注释:
- # 获取当前时间戳
- awk 'BEGIN {
- print "Number of seconds since the Epoch = " systime()
- }'
- # 将字符串转换为时间戳
- awk 'BEGIN {
- print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10")
- }'
-
- # 格式化时间戳
- awk 'BEGIN {
- print strftime("Time = %m/%d/%Y %H:%M:%S", systime())
- }'
-
- # 打印当前星期几
- awk 'BEGIN {
- print strftime("%A")
- }'
函数名 | 功能 | 参数 | 示例 | 输出 |
and | 执行位与操作 | num1, num2 | and(10, 6) | 2 |
compl | 按位求补 | num1 | compl(10) | 9.0072E+15 |
lshift | 左移位操作 | num1, shift | lshift(10, 1) | 20 |
rshift | 向右移位操作 | num1, shift | rshift(10, 1) | 5 |
or | 按位或操作 | num1, num2 | or(10, 6) | 14 |
xor | 按位异或操作 | num1, num2 | xor(10, 6) | 12 |
注释:
- # 位与操作
- awk 'BEGIN {
- num1 = 10
- num2 = 6
- printf "(%d AND %d) = %d\n", num1, num2, and(num1, num2)
- }'
-
- # 按位求补
- awk 'BEGIN {
- num1 = 10
- printf "compl(%d) = %d\n", num1, compl(num1)
- }'
-
-
- # 左移位操作
- awk 'BEGIN {
- num1 = 10
- printf "lshift(%d) by 1 = %d\n", num1, lshift(num1, 1)
- }'
-
-
- # 向右移位操作。
- awk 'BEGIN {
- num1 = 10
- printf "rshift(%d) by 1 = %d\n", num1, rshift(num1, 1)
- }'
-
-
-
- # 按位或操作。
- awk 'BEGIN {
- num1 = 10
- num2 = 6
- printf "(%d OR %d) = %d\n", num1, num2, or(num1, num2)
- }'
-
-
- # 按位异或操作
- [jerry]$ awk 'BEGIN {
- num1 = 10
- num2 = 6
- printf "(%d XOR %d) = %d\n", num1, num2, xor(num1, num2)
- }'
函数名 | 功能 | 参数 | 示例 | 输出 |
close(expr) | 关闭管道的文件 | expr | close(cmd, "to") | - |
delete | 从数组中删除元素 | 数组索引 | delete arr[0] | - |
exit([expr]) | 终止脚本执行 | expr | exit 10 | - |
fflush([output-expr]) | 刷新打开文件或管道的缓冲区 | output-expr | fflush() | - |
getline | 读入下一行 | - | getline < file | - |
next | 停止处理当前记录,进入下一条记录的处理过程 | - | if ($0 ~/Shyam/) next | - |
nextfile | 停止处理当前文件,从下一个文件第一个记录开始处理 | - | if ($0 ~ /file1:str2/) nextfile | - |
return([expr]) | 从用户自定义的函数中返回值 | expr | return result | - |
system(cmd) | 执行特定的命令 | cmd | system("date") | 0 |
注释:
- # 关闭管道
- awk 'BEGIN {
- cmd = "tr [a-z] [A-Z]"
- print "hello, world !!!" |& cmd
- close(cmd, "to")
- cmd |& getline out
- print out;
- close(cmd);
- }'
-
-
- # 从数组中删除元素
- awk 'BEGIN {
- arr[0] = "One"
- arr[1] = "Two"
- arr[2] = "Three"
- arr[3] = "Four"
- print "删除前:"
- for (i in arr) {
- print arr[i]
- }
- delete arr[0]
- delete arr[1]
- print "删除后:"
- for (i in arr) {
- print arr[i]
- }
- }'
-
-
- # 终止脚本执行
- awk 'BEGIN {
- print "Hello, World !!!"
- exit 10
- print "AWK never executes this statement."
- }'
-
-
-
- # 刷新打开文件或管道的缓冲区
- fflush([output-expr])
-
-
-
- # 读入下一行
- awk '{getline; print $0}' file.txt
-
-
- # 执行特定的命令然后返回其退出状态。返回值为 0 表示命令执行成功;非 0 表示命令执行失败。
- awk 'BEGIN { ret = system("date"); print "Return value = " ret }'
如果您觉得有些用处,熟练操作这些代码后,相信你会有一些收获。
欢迎在评论区留言,关注。谢谢您的阅读!
敬请关注!
往期学习笔记:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。