awk实用技巧让Linux命令行更强大

2023-10-05 04:29:48

awk 简介：文本处理利器
awk 是一种强大的文本处理工具，最初由加州大学的阿霍（Alfred Aho）、韦恩伯格（Peter Weinberger）和克努斯（Brian Kernighan）共同开发。awk 的名称正是取自三位作者姓氏首字母的缩写。awk 通常被称作模式扫描和处理语言（Pattern Scanning and Processing Language），这种语言很适合编写复杂的文本处理脚本。

awk 的工作原理
awk 的工作原理是将文本文件中的每一行作为输入，并根据指定模式对每一行进行处理。awk脚本由一系列模式-动作对组成，模式用于指定要匹配的行，动作用于指定对匹配行的处理操作。awk 脚本的典型结构如下：

BEGIN {
    # 脚本开始时执行的操作
}

PATTERN {
    # 匹配到指定模式时执行的操作
}

END {
    # 脚本结束时执行的操作
}

awk 常用模式
awk 中常用的模式包括：

基本正则表达式： 用于匹配字符串。
通配符： 用于匹配文件路径或文件名。
内置变量： 用于访问awk 的内置变量，如 $0（当前行）、$1（第一列）、$2（第二列）等。

awk 常用动作
awk 中常用的动作包括：

打印： 使用 print 语句将数据打印到标准输出。
赋值： 使用赋值语句将值赋给变量。
数学运算： 使用数学运算符对数值进行计算。
字符串操作： 使用字符串操作函数对字符串进行处理，如子字符串提取、替换等。

awk 实战案例
接下来，让我们通过几个实战案例来展示 awk 的强大功能。

1. 提取指定列数据

awk -F ',' '{print $3}' data.csv

这个脚本将 data.csv 文件中的第三列数据提取出来，并打印到标准输出。

2. 统计字符出现次数

awk '{print $1, length($1)}' data.txt | sort -nrk2

这个脚本将 data.txt 文件中的每一行的第一个单词提取出来，并统计每个单词的长度，然后按长度降序排列。

3. 计算文件行数

这个脚本计算 data.txt 文件的行数，并打印到标准输出。

结论
awk 是一款功能强大的文本处理工具，非常适合从文本文件中提取和处理数据。它在Linux系统中广泛应用于各种文本处理任务，如数据提取、格式转换、统计分析等。本文介绍了 awk 的基本原理、常用模式、常用动作以及几个实战案例，希望能帮助您更好地掌握 awk 的使用，在Linux命令行中更加游刃有余。

Kyle

探索Web开发资源和人工智能教程的代码社区

联系我

扫码关注微信公众号

awk实用技巧让Linux命令行更强大

Kyle

利用Map与Set两大法宝，全面掌握es6基础

克服初级前端面试中常见的问题：解决“愚蠢”的JS问题

如何抵御SSH暴力攻击：深入解析Denyhosts的工作原理

NestJS 开发中的数据验证利器：ValidationPipe

精准把脉前端团队自动化部署指南 - 环境篇