当前位置:   article > 正文

Linux文本处理三剑客:awk(内置函数详解笔记)

Linux文本处理三剑客:awk(内置函数详解笔记)

Linux系统中,AWK 是一个非常强大的文本处理工具,它的内置函数使得对文本数据进行处理更加高效和便捷。

本文将介绍 AWK 内置函数的几种主要类型:

  • 算数函数
  • 字符串函数
  • 时间函数
  • 位操作函数
  • 其他常用函数

我们将使用一个示例文本文件来演示这些函数的用法,并提供详细的注释说明,继续分享。

基础学习,可以回头查看:Linux文本处理三剑客:awk(结构化命令)

1.算数函数

函数名功能参数示例输出
atan2(y,x)返回正切值 y/x 的角度值,角度以弧度为单位y, xatan2(10, -10) * 180 / PI135
cos(expr)返回 expr 的余弦值,输入参数以弧度为单位exprcos(60 * PI / 180.0)0.5
exp(expr)返回自然数 e 的 expr 次幂exprexp(5)148.413159
int(expr)返回数值 expr 的整数部分exprint(5.12345)5
log(expr)计算 expr 自然对数exprlog(5.5)1.704748
rand返回一个大于等于 0 小于 1 的随机数-rand()0.237788
sin(expr)返回角度 expr 的正弦值,角度以弧度为单位exprsin(30 * PI / 180)0.5
sqrt(expr)计算 expr 的平方根exprsqrt(1024.0)32
srand([expr])使用种子值生成随机数exprsrand(10)1417959587

注释:

  • 以上表格仅列出了 AWK 提供的内置算术函数。
  • 算术函数的参数必须是数值。
  • 算术函数的返回值是数值。
  1. # 反正切函数
  2. awk 'BEGIN {
  3. PI = 3.14159265
  4. x = -10
  5. y = 10
  6. result = atan2 (y,x) * 180 / PI;
  7. printf "对于 (x=%f, y=%f),反正切值为 %f 度\n", x, y, result
  8. }'
  9. # 余弦函数
  10. awk 'BEGIN {
  11. PI = 3.14159265
  12. param = 60
  13. result = cos(param * PI / 180.0);
  14. printf "%f 度的余弦值为 %f\n", param, result
  15. }'
  16. # 自然指数函数
  17. awk 'BEGIN {
  18. param = 5
  19. result = exp(param);
  20. printf "%f 的自然指数值为 %f\n", param, result
  21. }'
  22. # 取整函数
  23. awk 'BEGIN {
  24. param = 5.12345
  25. result = int(param)
  26. print "Truncated value =", result
  27. }'
  28. # 自然对数函数
  29. awk 'BEGIN {
  30. param = 5.5
  31. result = log (param)
  32. printf "log(%f) = %f\n", param, result
  33. }'
  34. # 随机数函数
  35. awk 'BEGIN {
  36. print "Random num1 =" , rand()
  37. print "Random num2 =" , rand()
  38. print "Random num3 =" , rand()
  39. }'
  40. #正弦函数
  41. awk 'BEGIN {
  42. PI = 3.14159265
  43. param = 30.0
  44. result = sin(param * PI /180)
  45. printf "The sine of %f degrees is %f.\n", param, result
  46. }'
  47. # 平方根函数
  48. awk 'BEGIN {
  49. param = 1024.0
  50. result = sqrt(param)
  51. printf "sqrt(%f) = %f\n", param, result
  52. }'
  53. # 设置随机数种子
  54. awk 'BEGIN {
  55. param = 10
  56. printf "srand() = %d\n", srand()
  57. printf "srand(%d) = %d\n", param, srand(param)
  58. }'

2.字符串函数

函数名功能参数示例输出
asort(arr, [d [, how]])使用 GAWK 值比较的一般规则排序 arr 中的内容arr, d, howasort(arr)-
asorti(arr, [d [, how]])对数组的索引排序arr, d, howasorti(arr)-
gsub(regexp, replacement [, target])全局替换子串regexp, replacement, targetgsub("World", "Jerry", str)Hello, Jerry
index(str, sub)检测子串是否存在str, subindex(str, subs)5
length(str)返回字符串长度strlength(str)16
match(str, regex)搜索与正则表达式匹配的子串str, regexmatch(str, subs)5
split(str, arr, regex)分割字符串str, arr, regexsplit(str, arr, ",")One, Two, Three, Four
sprintf(format, expr-list)按指定格式构造字符串format, expr-listsprintf("%s", "Hello, World !!!")Hello, World !!!
strtonum(str)将字符串转换为数值strstrtonum("123")123
sub(regex, sub, string)执行一次子串替换regex, sub, stringsub("World", "Jerry", str)Hello, Jerry
substr(str, start, l)返回子串str, start, lsubstr(str, 1, 5)Hello
tolower(str)将所有大写字母转换为小写字母strtolower(str)hello, world !!!
toupper(str)将所有小写字母转换为大写字母strtoupper(str)HELLO, WORLD !!!

注释:

  • 以上表格仅列出了 AWK 提供的内置字符串函数。
  • 字符串函数的参数可以是字符串或变量。
  • 字符串函数的返回值是字符串。
  1. # 按字母顺序排列数组元素
  2. $ awk 'BEGIN {
  3. arr[0] = "Three"
  4. arr[1] = "One"
  5. arr[2] = "Two"
  6. print "排序前数组元素:"
  7. for (i in arr) {
  8. print arr[i]
  9. }
  10. asort(arr)
  11. print "排序后数组元素:"
  12. for (i in arr) {
  13. print arr[i]
  14. }
  15. }'
  16. # 按索引顺序排列数组元素
  17. awk 'BEGIN {
  18. arr["Two"] = 1
  19. arr["One"] = 2
  20. arr["Three"] = 3
  21. asorti(arr)
  22. print "排序后数组索引:"
  23. for (i in arr) {
  24. print arr[i]
  25. }
  26. }'
  27. # 替换字符串
  28. awk 'BEGIN {
  29. str = "Hello, World"
  30. print "替换前字符串 = " str
  31. gsub("World", "Jerry", str)
  32. print "替换后字符串 = " str
  33. }'
  34. # 查找子串的位置
  35. awk 'BEGIN {
  36. str = "One Two Three"
  37. subs = "Two"
  38. ret = index(str, subs)
  39. printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
  40. }'
  41. # 获取字符串长度
  42. awk 'BEGIN {
  43. str = "Hello, World !!!"
  44. print "长度 = ", length(str)
  45. }'
  46. # 使用正则表达式匹配子串
  47. awk 'BEGIN {
  48. str = "One Two Three"
  49. subs = "Two"
  50. ret = match(str, subs)
  51. printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
  52. }'
  53. # 将字符串分割为数组
  54. awk 'BEGIN {
  55. str = "One,Two,Three,Four"
  56. split(str, arr, ",")
  57. print "数组包含以下元素:"
  58. for (i in arr) {
  59. print arr[i]
  60. }
  61. }'
  62. # 使用 sprintf() 格式化字符串
  63. awk 'BEGIN {
  64. str = sprintf("%s", "Hello, World !!!")
  65. print str
  66. }'
  67. # 将字符串转换为数字
  68. awk 'BEGIN {
  69. print "Decimal num = " strtonum("123")
  70. print "Octal num = " strtonum("0123")
  71. print "Hexadecimal num = " strtonum("0x123")
  72. }'
  73. # 使用 sub() 替换字符串
  74. awk 'BEGIN {
  75. str = "Hello, World"
  76. print "替换前字符串 = " str
  77. sub("World", "Jerry", str)
  78. print "替换后字符串 = " str
  79. }'
  80. # 获取子字符串
  81. awk 'BEGIN {
  82. str = "Hello, World !!!"
  83. subs = substr(str, 1, 5)
  84. print "Substring = " subs
  85. }'
  86. # 小写转换
  87. awk 'BEGIN {
  88. str = "HELLO, WORLD !!!"
  89. print "Lowercase string = " tolower(str)
  90. }'
  91. # 大写转换
  92. awk 'BEGIN {
  93. str = "hello, world !!!"
  94. print "Uppercase string = " toupper(str)
  95. }'

3.时间函数

函数名功能参数示例输出
systime返回从 Epoch 以来到当前时间的秒数-systime()1418574432
mktime(datespec)将字符串转换为时间戳datespecmktime("2014 12 14 30 20 10")1418604610
strftime([format [, timestamp[, utc-flag]]])格式化时间戳format, timestamp, utc-flagstrftime("Time = %m/%d/%Y %H:%M:%S", systime())Time = 12/14/2014 22:08:42

注释:

  • 以上表格仅列出了 AWK 提供的内置时间函数。
  • 时间戳是一个数值,表示从 Epoch 以来经过的秒数。
  • Epoch 是 Unix 时间的起点,为 1970 年 1 月 1 日 00:00:00 UTC。
  1. # 获取当前时间戳
  2. awk 'BEGIN {
  3. print "Number of seconds since the Epoch = " systime()
  4. }'
  5. # 将字符串转换为时间戳
  6. awk 'BEGIN {
  7. print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10")
  8. }'
  9. # 格式化时间戳
  10. awk 'BEGIN {
  11. print strftime("Time = %m/%d/%Y %H:%M:%S", systime())
  12. }'
  13. # 打印当前星期几
  14. awk 'BEGIN {
  15. print strftime("%A")
  16. }'

4.位操作函数

函数名功能参数示例输出
and执行位与操作num1, num2and(10, 6)2
compl按位求补num1compl(10)9.0072E+15
lshift左移位操作num1, shiftlshift(10, 1)20
rshift向右移位操作num1, shiftrshift(10, 1)5
or按位或操作num1, num2or(10, 6)14
xor按位异或操作num1, num2xor(10, 6)12

注释:

  • 以上表格仅列出了 AWK 提供的内置位操作函数。
  • 位操作函数的参数必须是整数。
  • 位操作函数的返回值是整数。
  1. # 位与操作
  2. awk 'BEGIN {
  3. num1 = 10
  4. num2 = 6
  5. printf "(%d AND %d) = %d\n", num1, num2, and(num1, num2)
  6. }'
  7. # 按位求补
  8. awk 'BEGIN {
  9. num1 = 10
  10. printf "compl(%d) = %d\n", num1, compl(num1)
  11. }'
  12. # 左移位操作
  13. awk 'BEGIN {
  14. num1 = 10
  15. printf "lshift(%d) by 1 = %d\n", num1, lshift(num1, 1)
  16. }'
  17. # 向右移位操作。
  18. awk 'BEGIN {
  19. num1 = 10
  20. printf "rshift(%d) by 1 = %d\n", num1, rshift(num1, 1)
  21. }'
  22. # 按位或操作。
  23. awk 'BEGIN {
  24. num1 = 10
  25. num2 = 6
  26. printf "(%d OR %d) = %d\n", num1, num2, or(num1, num2)
  27. }'
  28. # 按位异或操作
  29. [jerry]$ awk 'BEGIN {
  30. num1 = 10
  31. num2 = 6
  32. printf "(%d XOR %d) = %d\n", num1, num2, xor(num1, num2)
  33. }'

5.其他常用函数

函数名功能参数示例输出
close(expr)关闭管道的文件exprclose(cmd, "to")-
delete从数组中删除元素数组索引delete arr[0]-
exit([expr])终止脚本执行exprexit 10-
fflush([output-expr])刷新打开文件或管道的缓冲区output-exprfflush()-
getline读入下一行-getline < file-
next停止处理当前记录,进入下一条记录的处理过程-if ($0 ~/Shyam/) next-
nextfile停止处理当前文件,从下一个文件第一个记录开始处理-if ($0 ~ /file1:str2/) nextfile-
return([expr])从用户自定义的函数中返回值exprreturn result-
system(cmd)执行特定的命令cmdsystem("date")0

释:

  • 以上表格仅列出了 AWK 提供的其它内置函数。
  • 每个函数的具体使用方法请参考 AWK 官方文档。
  1. # 关闭管道
  2. awk 'BEGIN {
  3. cmd = "tr [a-z] [A-Z]"
  4. print "hello, world !!!" |& cmd
  5. close(cmd, "to")
  6. cmd |& getline out
  7. print out;
  8. close(cmd);
  9. }'
  10. # 从数组中删除元素
  11. awk 'BEGIN {
  12. arr[0] = "One"
  13. arr[1] = "Two"
  14. arr[2] = "Three"
  15. arr[3] = "Four"
  16. print "删除前:"
  17. for (i in arr) {
  18. print arr[i]
  19. }
  20. delete arr[0]
  21. delete arr[1]
  22. print "删除后:"
  23. for (i in arr) {
  24. print arr[i]
  25. }
  26. }'
  27. # 终止脚本执行
  28. awk 'BEGIN {
  29. print "Hello, World !!!"
  30. exit 10
  31. print "AWK never executes this statement."
  32. }'
  33. # 刷新打开文件或管道的缓冲区
  34. fflush([output-expr])
  35. # 读入下一行
  36. awk '{getline; print $0}' file.txt
  37. # 执行特定的命令然后返回其退出状态。返回值为 0 表示命令执行成功;非 0 表示命令执行失败。
  38. awk 'BEGIN { ret = system("date"); print "Return value = " ret }'

如果您觉得有些用处,熟练操作这些代码后,相信你会有一些收获。

欢迎在评论区留言,关注。谢谢您的阅读!

敬请关注!

往期学习笔记:

Windows系统开启Linux子系统(Ubuntu)

Linux常用命令(目录操作命令)

Linux常用命令:文件的创建、复制、移动、查找和删除命令

Linux常用命令:文本文件的查看与编辑

Linux常用命令:文本文件的拼接与分割

Linux常用命令:文件的权限管理

Linux常用命令:文件的下载、压缩与解压

Linux常用命令:常见的操作符

Linux常用命令:系统操作命令
 

 Linux文本处理三剑客:grep

Linux文本处理三剑客:sed

Linux文本处理三剑客:awk

Linux文本处理三剑客:awk(常用匹配模式)

Linux文本处理三剑客:awk(结构化命令)

Linux文本处理三剑客:awk(对具体文本的示例代码)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/191106
推荐阅读
相关标签
  

闽ICP备14008679号