CSV処理に重要なツール AWK
2013年01月06日 09:28
AWK
開発者である3人の苗字の頭文字を取ってAWK 、「オーク」と読む。
プログラミング言語の一種だが、ユニケージではパイプの途中でフィルタとして用いる。
空白区切りデータを処理する。
テキストを1行ずつ処理する。
1行が分解されて、$1 $2のような変数に格納される。
(だから、フォールドを分割する、という処理を書かずに済む!)
読まれたレコードは、パターンに照合され、アクションで処理される。
[kaoru@lecture1 awk]$ cat hoge | awk '$1=="20110302"{print $1,$2}'
20110302 バナナ
20110302 リンゴ
だと '$1=="20110302"がパターン、{print $1,$2}'がアクション。
パターンで一致する行が見つかったときに指定されたアクション(動作) を実行。
[kaoru@lecture1 awk]$ echo 1 | awk '{print $1; $1++; print $1}'
1
2
;セミコロンで、複数処理もかける。