簡單的總結一下常用的一些實用的Linux文本操作命令,包括wc(統(tǒng)計)、cut(切分)、sort(排序)、uniq(去重)、grep(查找)、sed(替換、插入、刪除)、awk(文本分析)。
統(tǒng)計文件里面有多少單詞,多少行,多少字符。
# wc [-lwm] 選項與參數(shù): -l :僅列出行; -w :僅列出多少字(英文單字); -m :多少字符;
#wc /etc/passwd 40 45 1719 /etc/passwd
40是行數(shù),45是單詞數(shù),1719是字節(jié)數(shù)
wc的命令比較簡單使用,每個參數(shù)使用如下:
#wc -l /etc/passwd #統(tǒng)計行數(shù),在對記錄數(shù)時,很常用 /etc/passwd #表示系統(tǒng)有40個賬戶 #wc -w /etc/passwd #統(tǒng)計單詞出現(xiàn)次數(shù) /etc/passwd #wc -m /etc/passwd #統(tǒng)計文件的字節(jié)數(shù)
cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file]
使用說明
cut 命令從文件的每一行剪切字節(jié)、字符和字段并將這些字節(jié)、字符和字段寫至標準輸出。
如果不指定 File 參數(shù),cut 命令將讀取標準輸入。必須指定 -b、-c 或 -f 標志之一。
主要參數(shù)
-b :以字節(jié)為單位進行分割。這些字節(jié)位置將忽略多字節(jié)字符邊界,除非也指定了 -n 標志。
-c :以字符為單位進行分割。
-d :自定義分隔符,默認為制表符。
-f:與-d一起使用,指定顯示哪個區(qū)域。
-n :取消分割多字節(jié)字符。僅和 -b 標志一起使用。如果字符的最后一個字節(jié)落在由 -b 標志的 List 參數(shù)指示的<br />范圍之內,該字符將被寫出;否則,該字符將被排除。
cut命令主要是接受三個定位方法:
第一,字節(jié)(bytes),用選項-b
第二,字符(characters),用選項-c
第三,域(fields),用選項-f
舉個例子吧,當你執(zhí)行ps命令時,會輸出類似如下的內容:
$ who rocrocket :0 2009-01-08 11:07 rocrocket pts/0 2009-01-08 11:23 (:0.0) rocrocket pts/1 2009-01-08 14:15 (:0.0)
如果我們想提取每一行的第3個字節(jié),就這樣:
$ who|cut -b 3
如果“字節(jié)”定位中,我想提取第3,第4、第5和第8個字節(jié),怎么辦?
-b支持形如3-5的寫法,而且多個定位之間用逗號隔開就成了?纯蠢影桑
$ who|cut -b 3-5,8 croe croe croe
但有一點要注意,cut命令如果使用了-b選項,那么執(zhí)行此命令時,cut會先把-b后面所有的定位進行從小到大排序,然后再提取。因此這跟我們書寫的順序沒有關系。這個例子就可以說明這個問題:
$ who|cut -b 8,3-5 croe croe croe
還有哪些類似“3-5”這樣的小技巧,列舉一下吧!
$ who rocrocket :0 2009-01-08 11:07 rocrocket pts/0 2009-01-08 11:23 (:0.0) rocrocket pts/1 2009-01-08 14:15 (:0.0) $ who|cut -b -3 roc roc roc $ who|cut -b 3- crocket :0 2009-01-08 11:07 crocket pts/0 2009-01-08 11:23 (:0.0) crocket pts/1 2009-01-08 14:15 (:0.0)