導航:首頁 > 程序命令 > linux中split命令

linux中split命令

發布時間:2022-10-11 13:19:15

A. linux下我的split函數返回【ljava.lang.string這是怎麼回事

split把字元串分割後,返回的類型是數組String[]類型。你得用數組接收

B. linux文件拆分命令

Linux中分割文件用split命令,這個命令可以將一個文件分割成指定大小的多個文件,split命令的用法是:
split -b 分割的大小 需要分割的文件名 分割後文件的前導文字
這里解釋一下,-b參數表示按照文件大小單位來進行分割(split命令還有一個-l參數,是根據文本文件的行數來進行分割,這個-b參數是根據大小來分割的),-b參數後面跟的是分割的依據——文件大小,文件大小的單位可以是b、k、m,比如300m。「分割後文件的前導文字」是幹嘛的呢,其實是在分割後的文件名前面加上一個前綴。下面是一個例子,就假設需要分割的文件是/root/bigfile:
split -b 50m /root/bigfile chunk
這條命令產生的分割文件可能是:chunkaa、chunkab、chunkac,看到前導文字的作用了吧。
那麼如何將分割後的文件再合並起來呢,還是接著上面的那個例子,用下面這條命令就可以了(先用cd /root切換到/root目錄):
cat chunk* >> bigfile

C. 關於linux vi命令

vim命令總結
1.刪除字元
要刪除一個字元,只需要將游標移到該字元上按下"x"。
2.刪除一行
刪除一整行內容使用"dd"命令。刪除後下面的行會移上來填補空缺。
3.刪除換行符
在Vim中你可以把兩行合並為一行,也就是說兩行之間的換行符被刪除了:命令是"J"。
4.撤銷
如果你誤刪了過多的內容。顯然你可以再輸入一遍,但是命令"u" 更簡便,它可以撤消上一次的操作。
5.重做
如果你撤消了多次,你還可以用CTRL-R(重做)來反轉撤消的動作。換句話說,它是對撤消的撤消。撤消命令還有另一種形式,"U"命令,它一次撤消對一行的全部操作。第二次使用該命令則會撤消前一個"U"的操作。用"u"和CTRL-R你可以找回任何一個操作狀態。
6.追加
"i"命令可以在當前游標之前插入文本。
"a"命令可以在當前游標之後插入文本。
"o"命令可以在當前行的下面另起一行,並使當前模式轉為Insert模式。
"O"命令(注意是大寫的字母O)將在當前行的上面另起一行。
7.使用命令計數
假設你要向上移動9行。這可以用"kkkkkkkkk"或"9k"來完成。事實上,很多命令都可以接受一個數字作為重復執行同一命令的次數。比如剛才的例子,要在行尾追加三個感嘆號,當時用的命令是"a!!!"。另一個辦法是用"3a!"命令。3說明該命令將被重復執行3次。同樣,刪除3個字元可以用"3x"。指定的數字要緊挨在它所要修飾的命令前面。
8.退出
要退出Vim,用命令"ZZ"。該命令保存當前文件並退出Vim。
9.放棄編輯
丟棄所有的修改並退出,用命令":q!"。用":e!"命令放棄所有修改並重新載入該文件的原始內容。
10.以Word為單位的移動
使用"w"命令可以將游標向前移動一個word的首字元上;比如"3w"將游標向前移動3個words。"b"命令則將游標向後移動到前一個word的首字元上。
"e"命令會將游標移動到下一個word的最後一個字元。命令"ge",它將游標移動到前一個word的最後一個字元上。、
11.移動到行首或行尾
"$"命令將游標移動到當前行行尾。如果你的鍵盤上有一個鍵,它的作用也一樣。"^"命令將游標移動到當前行的第一個非空白字元上。"0"命令則總是把游標移動到當前行的第一個字元上。鍵也是如此。"$"命令還可接受一個計數,如"1$"會將游標移動到當前行行尾,"2$"則會移動到下一行的行尾,如此類推。"0"命令卻不能接受類似這樣的計數,命令"^"前加上一個計數也沒有任何效果。
12.移動到指定字元上
命令"fx"在當前行上查找下一個字元x(向右方向),可以帶一個命令計數"F"命令向左方向搜索。"tx"命令形同"fx"命令,只不過它不是把游標停留在被搜索字元上,而是在它之前的一個字元上。提示:"t"意為"To"。該命令的反方向版是"Tx"。這4個命令都可以用";"來重復。以","也是重復同樣的命令,但是方向與原命令的方向相反。
13.以匹配一個括弧為目的移動
用命令"%"跳轉到與當前游標下的括弧相匹配的那一個括弧上去。如果當前游標在"("上,它就向前跳轉到與它匹配的")"上,如果當前在")"上,它就向後自動跳轉到匹配的"("上去.
14.移動到指定行
用"G"命令指定一個命令計數,這個命令就會把游標定位到由命令計數指定的行上。比如"33G"就會把游標置於第33行上。沒有指定命令計數作為參數的話, "G"會把游標定位到最後一行上。"gg"命令是跳轉到第一行的快捷的方法。
另一個移動到某行的方法是在命令"%"之前指定一個命令計數比如"50%"將會把游標定位在文件的中間. "90%"跳到接近文件尾的地方。
命令"H","M","L",分別將游標跳轉到第一行,中間行,結尾行部分。
15.告訴你當前的位置
使用CTRL-G命令。"set number"在每行的前面顯示一個行號。相反關閉行號用命令":set nonumber"。":set ruler"在Vim窗口的右下角顯示當前游標位置。
16.滾屏
CTRL-U顯示文本的窗口向上滾動了半屏。CTRL-D命令將窗口向下移動半屏。一次滾動一行可以使用CTRL-E(向上滾動)和CTRL-Y(向下滾動)。要向前滾動一整屏使用命令CTRL-F。另外CTRL-B是它的反向版。"zz"命令會把當前行置為屏幕正中央,"zt"命令會把當前行置於屏幕頂端,"zb"則把當前行置於屏幕底端.
17.簡單搜索
"/string"命令可用於搜索一個字元串。要查找上次查找的字元串的下一個位置,使用"n"命令。如果你知道你要找的確切位置是目標字元串的第幾次出現,還可以在"n"之前放置一個命令計數。"3n"會去查找目標字元串的第3次出現。
"?"命令與"/"的工作相同,只是搜索方向相反."N"命令會重復前一次查找,但是與最初用"/"或"?"指定的搜索方向相反。
如果查找內容忽略大小寫,則用命令"set ignorecase", 返回精確匹配用命令"set noignorecase" 。
18.在文本中查找下一個word
把游標定位於這個word上然後按下"*"鍵。Vim將會取當前游標所在的word並將它作用目標字元串進行搜索。"#"命令是"*"的反向版。還可以在這兩個命令前加一個命令計數:"3*"查找當前游標下的word的第三次出現。
19.查找整個word
如果你用"/the"來查找Vim也會匹配到"there"。要查找作為獨立單詞的"the"使用如下命令:"/the\>"。"\>"是一個特殊的記法,它只匹配一個word的結束處。近似地,"\<"匹配到一個word的開始處。這樣查找作為一個word的"the"就可以用:"/\"。
20.高亮顯示搜索結果
開啟這一功能用":set hlsearch",關閉這一功能:":set nohlsearch"。如果只是想去掉當前的高亮顯示,可以使用下面的命令:":nohlsearch"(可以簡寫為noh)。
21.匹配一行的開頭與結尾
^ 字元匹配一行的開頭。$字元匹配一行的末尾。
所以"/was$"只匹配位於一行末尾的單詞was,所以"/^was"只匹配位於一行開始的單詞was。
22.匹配任何的單字元
.這個字元可以匹配到任何字元。比如"c.m"可以匹配任何前一個字元是c,後一個字元是m的情況,不管中間的字元是什麼。
23.匹配特殊字元
放一個反斜杠在特殊字元前面。如果你查找"ter。",用命令"/ter\。"
24.使用標記
當你用"G"命令從一個地方跳轉到另一個地方時,Vim會記得你起跳的位置。這個位置在Vim中是一個標記。使用命令" `` "可以使你跳回到剛才的出發點。
``命令可以在兩點之間來回跳轉。CTRL-O命令是跳轉到你更早些時間停置游標的位置(提示:O意為older). CTRL-I則是跳回到後來停置游標的更新的位置(提示:I在鍵盤上位於O前面)。
注:使用CTRL-I 與按下鍵一樣。
25.具名標記
命令"ma"將當前游標下的位置名之為標記"a"。從a到z一共可以使用26個自定義的標記。要跳轉到一個你定義過的標記,使用命令" `marks "marks就是定義的標記的名字。命令" 'a "使你跳轉到a所在行的行首," `a "會精確定位a所在的位置。命令:":marks"用來查看標記的列表。
命令delm!刪除所有標記。
26.操作符命令和位移
"dw"命令可以刪除一個word,"d4w"命令是刪除4個word,依此類推。類似有"d2e"、"d$"。此類命令有一個固定的模式:操作符命令+位移命令。首先鍵入一個操作符命令。比如"d"是一個刪除操作符。接下來是一個位移命。比如"w"。這樣任何移動游標命令所及之處,都是命令的作用范圍。
27.改變文本
操作符命令是"c",改變命令。它的行為與"d"命令類似,不過在命令執行後會進入Insert模式。比如"cw"改變一個word。或者,更准確地說,它刪除一個word並讓你置身於Insert模式。
"cc"命令可以改變整行。不過仍保持原來的縮進。
"c$"改變當前游標到行尾的內容。
快捷命令:x 代表dl(刪除當前游標下的字元)
X 代表dh(刪除當前游標左邊的字元)
D 代表d$(刪除到行尾的內容)
C 代表c$(修改到行尾的內容)
s 代表cl(修改一個字元)
S 代表cc(修改一整行)
命令"3dw"和"d3w"都是刪除3個word。第一個命令"3dw"可以看作是刪除一個word的操作執行3次;第二個命令"d3w"是一次刪除3個word。這是其中不明顯的差異。事實上你可以在兩處都放上命令記數,比如,"3d2w"是刪除兩個word,重復執行3次,總共是6個word。
28.替換單個字元
"r"命令不是一個操作符命令。它等待你鍵入下一個字元用以替換當前游標下的那個字元。"r"命令前輟以一個命令記數是將多個字元都替換為即將輸入的那個字元。要把一個字元替換為一個換行符使用"r"。它會刪除一個字元並插入一個換行符。在此處使用命令記數只會刪除指定個數的字元:"4r"將把4個字元替換為一個換行符。
29.重復改動
"."命令會重復上一次做出的改動。"."命令會重復你做出的所有修改,除了"u"命令CTRL-R和以冒號開頭的命令。"."需要在Normal模式下執行,它重復的是命令,而不是被改動的內容,
30.Visual模式
按"v"可以進入Visual模式。移動游標以覆蓋你想操縱的文本范圍。同時被選中的文本會以高亮顯示。最後鍵入操作符命令。
31.移動文本
以"d"或"x"這樣的命令刪除文本時,被刪除的內容還是被保存了起來。你還可以用p命令把它取回來。"P"命令是把被去回的內容放在游標之前,"p"則是放在游標之後。對於以"dd"刪除的整行內容,"P"會把它置於當前行的上一行。"p"則是至於當前行的後一行。也可以對命令"p"和"P"命令使用命令記數。它的效果是同樣的內容被取回指定的次數。這樣一來"dd"之後的"3p"就可以把被刪除行的3 份副本放到當前位置。
命令"xp"將游標所在的字元與後一個字元交換。
32.復制文本(VIM編輯器內復制)
"y"操作符命令會把文本復制到一個寄存器3中。然後可以用"p"命令把它取回。因為"y"是一個操作符命令,所以你可以用"yw"來復制一個word. 同樣可以使用命令記數。如下例中用"y2w"命令復制兩個word,"yy"命令復制一整行,"Y"也是復制整行的內容,復制當前游標至行尾的命令是"y$"。
33.文本對象
"diw" 刪除當前游標所在的word(不包括空白字元) "daw" 刪除當前游標所在的word(包括空白字元)
34.快捷命令
x 刪除當前游標下的字元("dl"的快捷命令)
X 刪除當前游標之前的字元("dh"的快捷命令)
D 刪除自當前游標至行尾的內容("d$"的快捷命令)
dw 刪除自當前游標至下一個word的開頭
db 刪除自當前游標至前一個word的開始
diw 刪除當前游標所在的word(不包括空白字元)
daw 刪除當前游標所在的word(包括空白字元)
dG 刪除當前行至文件尾的內容
dgg 刪除當前行至文件頭的內容
如果你用"c"命令代替"d"這些命令就都變成更改命令。使用"y"就是yank命令,如此類推。
35.編輯另一個文件
用命令":edit foo.txt",也可簡寫為":e foo.txt"。
36.文件列表
可以在啟動Vim時就指定要編輯多個文件,用命令"vim one.c two.c three.c"。Vim將在啟動後只顯示第一個文件,完成該文件的編輯後,可以用令:":next"或":n"要保存工作成果並繼續下一個文件的編輯,命令:":wnext"或":wn"可以合並這一過程。
37.顯示當前正在編輯的文件
用命令":args"。
38.移動到另一個文件
用命令":previous" ":prev"回到上一個文件,合並保存步驟則是":wprevious" ":wprev"。要移到最後一個文件":last",到第一個":first".不過沒有":wlast"或者":wfirst"這樣的命令。可以在":next"和":previous"命令前面使用一個命令計數。
39.編輯另一個文件列表
不用重新啟動Vim,就可以重新定義一個文件列表。命令":args five.c six.c seven.h"定義了要編輯的三個文件。
40.自動存檔
命令":set autowrite","set aw"。自動把內容寫迴文件: 如果文件被修改過,在每個:next、:rewind、:last、:first、:previous、:stop、:suspend、:tag、:!、:make、CTRL-] 和 CTRL-^命令時進行。
命令":set autowriteall","set awa"。和 'autowrite' 類似,但也適用於":edit"、":enew"、":quit"、":qall"、":exit"、":xit"、":recover" 和關閉 Vim 窗口。置位本選項也意味著 Vim 的行為就像打開 'autowrite' 一樣。
41.切換到另一文件
要在兩個文件間快速切換,使用CTRL-^。
42.文件標記
以大寫字母命名的標記。它們是全局標記,它們可以用在任何文件中。比如,正在編輯"fab1.java",用命令"50%mF"在文件的中間設置一個名為F的標記。然後在"fab2.java"文件中,用命令"GnB"在最後一行設置名為B的標記。在可以用"F"命令跳轉到文件"fab1.java"的半中間。或者編輯另一個文件,"'B"命令會再把你帶迴文件"fab2.java"的最後一行。
要知道某個標記所代表的位置是什麼,可以將該標記的名字作為"marks"命令的參數":marks M"或者連續跟上幾個參數":marks MJK"
可以用CTRL-O和CTRL-I可以跳轉到較早的位置和靠後的某位置。
43.查看文件
僅是查看文件,不向文件寫入內容,可以用只讀形式編輯文件。用命令:
vim -R file。如果是想強制性地避免對文件進行修改,可以用命令:
vim -M file。
44.更改文件名
將現有文件存成新的文件,用命令":sav(eas) move.c"。如果想改變當前正在編輯的文件名,但不想保存該文件,就可以用命令:":f(ile) move.c"。
45.分割一個窗口
打開一個新窗口最簡單的辦法就是使用命令:":split"。CTRL-W 命令可以切換當前活動窗口。
46.關閉窗口
用命令:"close".可以關閉當前窗口。實際上,任何退出文件編輯的命令":quit"和"ZZ"都會關閉窗口,但是用":close"可以阻止你關閉最後一個Vim,以免以意外地整個關閉了Vim。
47.關閉除當前窗口外的所有其他窗口
用命令:":only",關閉除當前窗口外的所有其它窗口。如果這些窗口中有被修改過的,你會得到一個錯誤信息,同時那個窗口會被留下來。
48.為另一個文件分隔出一個窗口
命令":split two.c"可以打開第二個窗口同時在新打開的窗口中開始編輯作為
參數的文件。如果要打開一個新窗口並開始編輯一個空的緩沖區,使用命令:":new"。
49.垂直分割
用命令":vsplit或::vsplit two.c"。同樣有一個對應的":vnew"命令,用於垂直分隔窗口並在其中打開一個新的空緩沖區。
50.切換窗口
CTRL-W h 到左邊的窗口
CTRL-W j 到下面的窗口
CTRL-W k 到上面的窗口
CTRL-W l 到右邊的窗口
CTRL-W t 到頂部窗口
CTRL-W b 到底部窗口
51.針對所有窗口操作的命令
":qall"放棄所有操作並退出,":wall"保存所有,":wqall"保存所有並退出。
52.為每一個文件打開一個窗口
使用"-o"選項可以讓Vim為每一個文件打開一個窗口:
"vim -o one.txt two.txt three.txt"。
53.使用vimdiff查看不同
"vimdiff main.c~ main.c",另一種進入diff模式的辦法可以在Vim運行中操作。編輯文件"main.c",然後打開另一個分隔窗口顯示其不同:
":edit main.c"
":vertical diffpatch main.c.diff"。
54.頁簽
命令":tabe(dit) thatfile"在一個窗口中打開"thatfile",該窗口占據著整個的Vim顯示區域。命令":tab split/new"結果是新建了一個擁有一個窗口的頁簽。以用"gt"命令在不同的頁簽間切換。

D. linux下如何把split分割後的文件跟tar打包操作合並

#split -b 100m -d name file ; tar -zcvf file.tar.gz file*

E. Linux裡面分割,切片是什麼

在Linux最常用的文件生成和切片工具是dd,它功能比較全面,但無法以行為單位提取文件數據,也無法直接將文件按大小或行數進行均分(除非藉助循環)。另兩款數據分割工具split和csplit能夠比較輕松地實現這些需求。csplit是split的升級版。
1.1 dd命令
從if指定的文件讀取數據,寫入到of指定的文件。使用bs指定讀取和寫入的塊大小,使用count指定讀取和寫入的數據塊數量,bs和count相乘就是文件總大小。可以指定skip忽略讀取if指定文件的前多少個塊,seek指定寫入到of指定文件時忽略前多少個塊。
dd if=/dev/zero of=/tmp/abc.1 bs=1M count=20
if是input file,of是output file;bs有c(1byte)、w(2bytes)、b(512bytes)、kB(1000bytes)、K(1024bytes)、MB(1000)、M(1024)和GB、G等幾種單位。因此,不要隨意在單位後加上字母B。
假設現有文件CentOS.iso的大小1.3G,需要將其切分後還原,切分的第一個小文件大小為500M。
dd if=/tmp/CentOS.iso of=/tmp/CentOS1.iso bs=2M count=250
生成第二個小文件,由於第二個小文件不知道具體大小,所以不指定count選項。由於第二個小文件要從第500M處開始切分,於是需要忽略CentOS.iso的前500M。假設bs=2M,於是skip掉的數據塊數量為250。
dd if=/tmp/CentOS.iso of=/tmp/CentOS2.iso bs=2M skip=250
現在CentOS.iso=CentOS1.iso+CentOS2.iso。可以將CentOS[1-2].iso還原。
cat CentOS1.iso CentOS2.iso >CentOS_m.iso
比較CentOS_m.iso和CentOS.iso的md5值,它們是完全一樣的。
shell> md5sum CentOS_m.iso CentOS.iso
CentOS_m.iso
CentOS.iso
那麼seek選項呢?和skip有什麼區別?skip選項是忽略讀取時的前N個數據塊,而seek是忽略寫入文件的前N個數據塊。假如要寫入的文件為a.log,則seek=2時,將從a.log的第3個數據塊開始追加數據,如果a.log文件本身大小就不足2個數據塊,則缺少的部分自動使用/dev/zero填充。
於是,在有了CentOS1.iso的基礎上,要將其還原為和CentOS.iso相同的文件,可以使用下面的方法:
dd if=/tmp/CentOS.iso of=/tmp/CentOS1.iso bs=2M skip=250 seek=250
還原後,它們的md5值也是相同的。
shell>md5sum CentOS1.iso CentOS.iso
CentOS1.iso
CentOS.iso
1.2 split命令
split工具的功能是將文件切分為多個小文件。既然要生成多個小文件,必然要指定切分文件的單位,支持按行切分以及按文件大小切分,另外還需解決小文件命名的問題。例如,文件名前綴、後綴。如果未明確指定前綴,則默認的前綴為"x"。
以下是命令的語法說明:
例如,將/etc/fstab按行切分,每5行切分一次,並指定小文件的前綴為"fs_",後綴為數值後綴,且後綴長度為2。
[root@linuxidc ~]# split -l 5 -d -a 2 /etc/fstab fs_
[root@linuxidc~]# lsfs_00 fs_01 fs_02
查看任一小文件。
[root@linuxidc ~]# catfs_01
# Accessible filesystems, by reference, are maintained under'/dev/disk'# Seeman pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info#
UUID=b2a70faf-aea4-4d8e-8be8-c7109ac9c8b8 / xfs defaults 0 0UUID=367d6a77-033b-4037-bbcb-416705ead095 /boot xfs defaults 0 0
可以將這些切分後的小文件重新組裝還原。例如,將上面的三個小文件還原為~/fstab.bak。
[root@linuxidc ~]# cat fs_0[0-2] >~/fstab.bak
還原後,它們的內容是完全一致的。可以使用md5sum比較。
[root@linuxidc ~]# md5sum /etc/fstab ~/fstab.bak
/etc/fstab
/root/fstab.bak
還可以將標准輸入的數據進行切分,並分別寫入到小文件中。例如:
[root@linuxidc ~]# seq 1 2 15 | split -l 3 -d -new_
[root@linuxidc~]# ls new*new_00 new_01 new_02
可以為每個小文件追加額外的後綴。有些老版本的split不支持該選項,而是在csplit上支持的,但是新版本的split已經支持。例如,加上".log"。
[root@linuxidc ~]# seq 1 2 20 | split -l 3 -d -a 3 --additional-suffix=".log" -new1_
[root@linuxidc~]# ls new1*new1_000.log new1_001.log new1_002.log new1_003.log
1.3 csplit命令
split只能按行或按照大小進行切分,無法按段落切分。csplit是split的變體,功能更多,它主要是按指定上下文按段落分割文件。
csplit [OPTION]... FILE PATTERN...
描述:按照PATTERN將文件切分為"xx00","xx01", ...,並在標准輸出中輸出每個小文件的位元組數。
選項說明:-b FORMAT:指定文件後綴格式,格式為printf的格式,默認為%02d。表示後綴以2位數值,且不足處以0填充。-f PREFIX:指定前綴,不指定是默認為"xx"。-k:用於突發情況。表示即使發生了錯誤,也不刪除已經分割完成的小文件。-m:明確禁止文件的行去匹配PATTERN。-s:(silent)不列印小文件的文件大小。-z:如果切分後的小文件中有空文件,則刪除它們。
FILE:待切分的文件,如果要切分標准輸入數據,則使用"-"。
PATTERNs:
INTEGER :數值,假如為N,表示拷貝1到N-1行的內容到一個小文件中,其餘內容到另一個小文件中。/REGEXP/[OFFSET]:從匹配到的行開始按照偏移量拷貝指定行數的內容到小文件中。
:其中OFFSET的格式為"+N"或"-N",表示向後和向前拷貝N行%REGEXP%[OFFSET]:匹配到的行被忽略。
{INTEGER} :假如值為N,表示重復N此前一個模式匹配。
{*} :表示一直匹配到文件結尾才停止匹配。
假設文件內容如下:
[root@linuxidc ~]# cattest.txt
SERVER-1[connection]192.168.0.1success
[connection]192.168.0.2failed
[disconnect]192.168.0.3pending
[connection]192.168.0.4success
SERVER-2[connection]192.168.0.1failed
[connection]192.168.0.2failed
[disconnect]192.168.0.3success
[CONNECTION]192.168.0.4pending
SERVER-3[connection]192.168.0.1pending
[connection]192.168.0.2pending
[disconnect]192.168.0.3pending
[connection]192.168.0.4 failed
假設每個SERVER-n表示一個段落,於是要按照段落切分該文件,使用以下語句:
[root@linuxidc ~]# csplit -f test_ -b %04d.log test.txt /SERVER/ {*}0
140
139
140
"-f test_" 指定小文件前綴為"test_", "-b %04d.log" 指定文件後綴格式"00xx.log",它自動為每個小文件追加額外的後綴".log", "/SERVER/" 表示匹配的模式,每匹配到一次,就生成一個小文件,且匹配到的行是該小文件中的內容, "{*}" 表示無限匹配前一個模式即/SERVER/直到文件結尾,假如不知道{*}或指定為{1},將匹配一次成功後就不再匹配。
[root@linuxidc ~]# ls test_*test_0000.log test_0001.log test_0002.log test_0003.log
上面的文件中雖然只有三個段落:SERVER-1,SERVER-2,SERVER-3,但切分的結果生成了4個小文件,並且注意到第一個小文件大小為0位元組。為什麼會如此?因為在模式匹配的時候,每匹配到一行,這一行就作為下一個小文件的起始行。由於此文件第一行"SERVER-1"就被/SERVER/匹配到了,因此這一行是作為下一個小文件的內容,在此小文件之前還自動生成一個空文件。
生成的空文件可以使用"-z"選項來刪除。
[root@linuxidc ~]# csplit -f test1_ -z -b %04d.log test.txt /SERVER/ {*}140
139
140
還可以指定只拷貝匹配到的行偏移數量。例如,匹配到行時,只拷貝它後面的1行(包括它自身共兩行),但多餘的行將放入下一個小文件中。
[root@linuxidc ~]# csplit -f test2_ -z -b %04d.log test.txt /SERVER/+2 {*}42
139
140
98
第一個小文件只有兩行。
[root@linuxidc ~]# cattest2_0000.log
SERVER-1[connection]192.168.0.1 success
SERVER-1段落的其餘內容放入到了第二個小文件中。
[root@linuxidc ~]# cattest2_0001.log
[connection]192.168.0.2failed
[disconnect]192.168.0.3pending
[connection]192.168.0.4success
SERVER-2[connection]192.168.0.1 failed
同理第三個小文件也一樣,直到最後一個小文件中存放剩餘所有無法匹配的內容。
[root@linuxidc ~]# cattest2_0003.log
[connection]192.168.0.2pending
[disconnect]192.168.0.3pending
[connection]192.168.0.4 failed
指定"-s"或"-q"選項以靜默模式運行,將不會輸出小文件的大小信息。
[root@linuxidc ~]# csplit -q -f test3_ -z -b %04d.log test.txt /SERVER/+2 {*}

F. linux查找目錄下的所有文件中是否含有某個字元串

查找目錄下的所有文件中是否含有某個字元串
find .|xargs grep -ri "IBM"
查找目錄下的所有文件中是否含有某個字元串,並且只列印出文件名
find .|xargs grep -ri "IBM" -l
1.正則表達式
(1)正則表達式一般用來描述文本模式的特殊用法,由普通字元(例如字元a-z)以及特殊字元(稱為元字元,如/、*、?等)組成。
(2)基本元字元集及其含義
^ :只匹配行首。 如^a 匹配以a開頭的行abc,a2e,a12,aaa,......
$ :只匹配行尾。 如^a 匹配以a結尾的行bca,12a,aaa,.......
* :匹配0個或多個此單字元。 如(a)* 匹配 空,a,aa,aaa,....
[] :只匹配[]內字元。可以是一個單字元,也可以是字元序列,用","將裡面要匹配的不同字元串分開。也可以使用-來表示[]內字元序列的范圍,如[1-5]表示[12345]
\ :只用來屏蔽一個元字元的特殊含義。 如\*,\',\",\|,\+,\^,\. 等
.:(點)只匹配任意單字元。
pattern\{n\}:只用來匹配前面pattern出現的次數.n為次數。如a\{2\}匹配aa.
pattern\{n,\}:含義同上,但次數最少為n.如a\{2,\}匹配aa,aaa,aaaa,.....
pattern\{n,m\}:含義同上,但次數在n和m之間。如a\{2,4\}匹配aa,aaa,aaaa三個
(3)舉例說明:
^$ :匹配空行
^.$ :匹配包含一個字元的行
\*\.pas :匹配以*.pas結尾的所有字元或文件
[0123456789]或[0-9] :假定要匹配任意一個數字
[a-z] :任意小寫字母
[A-Za-z] :任意大小寫字母
[S,s] :匹配大小寫S
[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\} :匹配IP地址 [0-9]\{3\}三個0-9組成的字元串;\. :匹配點(注意這里點是特殊的字元,所以要用"\"來屏蔽其含義)
2.find介紹
(1)查找具有某些特徵文件的命令,可遍歷當前目錄甚至於整個文件系統來查看某些文件或目錄,其遍歷大的文件系統時一般放在後台執行。
(2)find命令的一般形式
find pathname -options [-print -exec -ok]
-pathname :find命令所查找的目錄路徑。如用"."來表示當前的目錄,用/來表示系統根目錄
-print :find命令將匹配的文件輸出到標准輸出
-exec: find命令對匹配的文件執行該參數所給出的shell命令,相應的命令形式為
'command'{} \; (注意{}和\之間的空格)
-ok 和 -exec的作用相同,只不過以一種更為安全的模式來執行該參數所給出的shell命令,在執行每一個命令之前,都會給出提示,讓用戶來確定是否執行。
options有如下幾種:
-name :按照文件名查找文件
-perm :按照文件許可權來查找文件
-user :按照文件屬主來查找文件
-group :按照文件所屬的組來查找文件
-mtime -n +n 按照文件的更改時間來查找文件,-n表示文件更改時間距現在n天以內,+n表示文件更改時間距現在n天以前。find命令還有-atime 和-ctime選項,但它們都和-mtime選項相似。
-size n[c]查找文件長度為n塊的文件,帶有c時表示文件長度以位元組計。
-nogroup 查找無有效所屬組的文件,即該文件所屬的組在/etc/groups中不存在
-newer file1 !file2查找更改時間比文件file1新但比文件file2舊的文件
-depth 先查找指定目錄有無匹配文件,若無則再在子目錄中查找
-type 查找某一類型的文件,如
b :塊設備文件
d:目錄
e:字元設備文件
p;管道文件
l:符號鏈接文件
f:普通文件
(3)find命令舉例
find -name "*.txt" -print 查找txt結尾的文件並輸出到屏幕上
find /cmd ".sh" -print 查找/cmd目錄下所有sh文件,並輸出
find . -perm 755 -print 查找當前目錄下許可權為755的文件,並輸出
find `pwd` -user root -print 查找當前目錄下屬主為root的文件,並輸出
find ./ -group sunwill -print 查找當前目錄下所屬主是sunwill的文件
find /var -mtime -5 -print 查找/var目錄下更改時間為5天內的所有文件
find /var -mtime +5 -print 查找/var目錄下更改時間為5天以前的所有文件
find /var -newer "myfile1" ! -newer "myfile2" -print 查找/var目錄下比myfile1新,但是比myfile2舊的所有文件。
find /var -type d -print 查找/var目錄下所有目錄
find /var -type l -print 查找/var目錄下所有的符號鏈接文件。
find . -size +1000000c -print 查找當前目錄下大於1000000位元組的文件
find / -name "con.file" -depth -print 查找根目錄下有無"con.file",若無則在其子目錄中查找
find . -type f -exec ls -l {} \; 查找當前目錄下是否有普通文件,若有則執行ls -l
(4)xargs命令
在 使用find命令的-exec選項處理匹配到的文件時,find命令將所有匹配到的文件一起傳遞給exec。不幸的是,有些系統對能夠傳遞給exec的命 令長度有限制,這樣find命令運行幾分鍾之後就算出現溢出錯誤。錯誤信息通常是「參數列太長」或「參數列溢出」。這就是xargs的用處所在,特別是與 find命令一起使用,exec會發起多個進程,而xargs會多個,只有一個
find ./ -perm -7 -print | xargs chmod o-w 查找許可權為7的文件並傳遞給chmod處理
3.grep介紹
(1)grep 的一般格式為 grep [options] 基本正則表達式 [文件]
字元串參數最好採用是雙引號括,一是以防被誤解為shell命令,二是可以用來查找多個單片語成的字元串
-c:只輸出匹配行的記數
-i:不區分大小寫(只適用於單個字元)
-h:查詢多個文件時不顯示文件名
-H:只顯示文件名
-l:查詢多文件時只輸出包含匹配字元的文件名
-n:只顯示匹配行及其行號
-s:不顯示不存在或無匹配文本的錯誤信息。
-v:顯示不包含匹配文本的所有行。
(2)舉例說明:
grep ^[^210] myfile 匹配myfile中以非2、1、0開頭的行
grep "[5-8][6-9][0-3]" myfile 匹配myfile中第一位為5|6|7|8,第二位6|7|8|9,第三位為0|1|2|3的三個字元的行
grep "4\{2,4\}" myfile 匹配myfile中含有44,444或4444的行
grep "\?" myfile匹配myfile中含有任意字元的行
(3)grep命令類名
[[:upper:]] 表示[A-Z]
[[:alnum:]] 表示[0-9a-zA-Z]
[[:lower:]] 表示[a-z]
[[:space:]] 表示空格或者tab鍵
[[:digit:]] 表示[0-9]
[[:alpha:]] 表示[a-zA-Z]
如:grep "5[[:digit:]][[:digit:]]" myfile 匹配myfile中含有5開頭接下去兩位都是數字的行。
4.awk介紹
可以從文件或字元串中基於指定規則瀏覽和抽取信息,是一種自解釋的變成語言。
(1)awk命令行方式 awk [-F filed-spearator] 'command' input-files
awk腳本:所有awk命令插入一個文件,並使awk程序可執行,然後用awk命令解釋器作為腳本的首行,以便通過鍵入腳本名稱來調用它。awk腳本是由各種操作和模式組成。
模式部分決定動作語句何時觸發及觸發事件。(BEGIN,END)
動作對數據進行處理,放在{}內指明(print)
(2)分隔符、域和記錄
awk執行時,其瀏覽域標記為$1,$2,...$n.這種方法成為域標識。$0為所有域。
(3)舉例說明:
awk '{print $0}' test.txt |tee test.out 輸出test.txt中所有行$0表示所有域
awk -F : '{print $1} test.txt |tee test.out' 同上。。只是分隔符為":"
awk 'BEGIN {print "IPDate\n"}{print $1 "\t" $4} END{print "end-of-report"}' test.txt
開始時列印「IPDate」結束時列印「end-of-report」中間列印主體信息,比如總共匹配三條信息,則輸出如下:
IPDate
1 first
2 second
3 third
end-of-report
(4)匹配操作符 ~ 匹配,!~ 不匹配
cat test.txt |awk '$0~/210.34.0.13/' 匹配test.txt中為210.34.0.13的行
awk '$0!~/210.34.0.13' test.txt 匹配test.txt中不是210.34.0.13的行
awk '{if($1=="210.34.0.13") print $0}' test.txt 匹配 test.txt中第一個域為210.34.0.13的行。
5.sed介紹
sed不與初始化文件打交道,它操作的只是一個拷貝,然後所有的改動如果沒有重定向到一個文件,將輸出到屏幕。
sed是一種很重要的文本過濾工具,使用一行命令或者使用管道與grep與awk相結合。是一種非交互性文本流編輯。
(1)調用sed的三種方式
使用sed命令行格式為:sed [options] sed命令 輸入文件
使用sed腳本文件格式為:sed[options] -f sed腳本文件 輸入文件
sed腳本文件[options] 輸入文件
--不管是使用shell命令行方式或腳本文件方式,如果沒有指定輸入文件,sed從標准輸入中接受輸入,一般是鍵盤或重定向結果。
(2)sed 命令的options如下
-n:不列印
-c:下一命令是編輯命令
-f:如果正在調用sed腳本文件
(3)sed在文件中查詢文本的方式
--使用行號,可以是一個簡單的數字,或是一個行號的范圍
--使用正則表達式
(4)讀取文本的方式
x x為一行號
x,y 表示行號范圍從x到y
/pattern/ 查詢包含模式的行
/pattern/pattern/ 查詢包含兩個模式的行
pattern/,x 在給定的行號上查詢包含模式的行
x,/pattern/ 通過行號和模式查詢匹配行
x,y! 查詢不包含指定行號x和y的行
(5)基本sed編輯命令
p 列印匹配行
d 刪除匹配行
= 顯示文件行號
a\ 在定位行號後附加新文本信息
i\ 在定位行號後插入新文本信息
c\ 用新文本替換定位文本
s 使用替換模式替換相應模式
r 從另一個文件中讀文件
w 寫文本到一個文件
q 第一個模式匹配完成後推出或立即退出
l 顯示與八禁止ASCII代碼等價的控制字元
{} 在定位行執行的命令組
n 從另一個文件中讀文本下一行,並附加在下一行
g 將模式2粘貼到/pattern n/
y 傳送字元
(6)舉例說明:
sed -n '2p' test.txt 列印第二行的信息(注意:-n是不列印不匹配的信息,若沒加-n,則列印文件的所有信息而不是匹配信息)
sed -n '1,4p' test.txt 列印第一行到第四行的信息
sed -n '/los/p' test.txt模式匹配los,並列印出來
sed -n '2,/los/p' test.txt 從第二行開始。。知道匹配第一個los
sed -n '/^$/p' test.txt 匹配空行
sed -n -e '/^$/p' -e '/^$/=' test.txt 列印空行及行號
sed -n '/good/a\morning' test.txt 在匹配到的good後面附加morning
sed -n '/good/i\morning' test.txt 在匹配到的good前面插入morning
sed -n '/good/c\morning' test.txt 將匹配到的good替換成morning
sed '1,2d' test.txt 刪除第1和2行
sed 's/good/good morning/g' test.txt 匹配good並替換成goodmorning
send 's/good/& hello /p' test.txt 匹配到good就在其後面加上hello
send 's/good/ hello &/p' test.txt 匹配到good就在其前面加上hello
6.合並與分割(sort,uniq,join,cut,paste,split)
(1)sot命令
sort [options] files 許多不同的域按不同的列順序排序
-c 測試文件是否已經排序
-m 合並兩個排序文件
-u 刪除所有同樣行
-o 存儲sort結果的輸出文件名
-t 域分隔符,用非空格或tab開始排序
+n :n 為列號,使用此列號開始排序
-n 指定排序是域上的數字分類項
-r 比較求逆
sort -c test.txt 測試文件是否分類過
sort -u test.txt 排序並合並一樣的行
sort -r test.txt 以相反的順序排列
sort -t "/" +2 test.txt 以"/"分隔,第二個域開始分類
(2)uniq命令
uniq [options ] files 從一個文本文件中去除或禁止重復行
-u 只顯示不重復行
-d 只顯示有重復數據行,每種重復行只顯示其中一行
-c 列印每一重復行出現次數
-f :n為數字,前n個域被忽略
uniq -f 2 test.txt 忽略前2個域
(3)join 命令
join [options] file1 file2 用來將來自兩個分類文本文件的行連在一起
-an,n為一數字,用於連接時從文件n中顯示不匹配行
-onm ,連接域,n為文件號,m為域號
-jnm,n為文件號,m為域號,使用其他域作連接域
-t ,域分隔符。用來設置非空格或tab鍵的域分隔符。
(4)split命令
split -output_file_size intput_filename output_filename
用來將大文件分割成小文件。
-b n,每個分割文件的大小n
-C n,每個分割文件一行最多n位元組
-l n,每個分割文件的行數
-n,同-l n
split -10 test.txt 將test.txt分割成10行的小文件
(5)cut 命令
cut -c n1-n2 filename 顯示每行從開頭算起 n1 到 n2 的文字。
cut -c 3-5 test.txt 顯示test.txt中每行從第3到第5個字元
Linux查找文件內容的常用命令方法:

1、從文件內容查找匹配指定字元串的行:
$ grep "被查找的字元串" 文件名

2、從文件內容查找與正則表達式匹配的行:
$ grep –e 「正則表達式」 文件名

3、查找時不區分大小寫:
$ grep –i "被查找的字元串" 文件名

4、查找匹配的行數:
$ grep -c "被查找的字元串" 文件名

5、從文件內容查找不匹配指定字元串的行:
$ grep –v "被查找的字元串" 文件名

6、從根目錄開始查找所有擴展名為.log的文本文件,並找出包含」ERROR」的行
find / -type f -name "*.log" | xargs grep "ERROR"

7、例子 :查找/SqLogs/access.log文件中包含".exe" 或者"TCP_DENIED"的記錄
方法1:grep /SqLogs/access.log –e ".exe」
grep /SqLogs/access.log –e "TCP_DENIED」
方法2:find /SqLogs –type f –name access.log | xargs grep ".exe"
find /SqLogs –type f –name access.log | xargs grep "TCP_DENIED"

G. 請問Linux中split的小文件怎麼打開

H. linux查找目錄下的所有文件中是否含有某個字元串

查找目錄下的所有文件中是否含有某個字元串

查找目錄下的所有文件中是否含有某個字元串
find .|xargs grep -ri "IBM"
查找目錄下的所有文件中是否含有某個字元串,並且只列印出文件名
find .|xargs grep -ri "IBM" -l
1.正則表達式
(1)正則表達式一般用來描述文本模式的特殊用法,由普通字元(例如字元a-z)以及特殊字元(稱為元字元,如/、*、?等)組成。
(2)基本元字元集及其含義
^ :只匹配行首。 如^a 匹配以a開頭的行abc,a2e,a12,aaa,......
$ :只匹配行尾。 如^a 匹配以a結尾的行bca,12a,aaa,.......
* :匹配0個或多個此單字元。 如(a)* 匹配 空,a,aa,aaa,....
[] :只匹配[]內字元。可以是一個單字元,也可以是字元序列,用","將裡面要匹配的不同字元串分開。也可以使用-來表示[]內字元序列的范圍,如[1-5]表示[12345]
\ :只用來屏蔽一個元字元的特殊含義。 如\*,\',\",\|,\+,\^,\. 等
.:(點)只匹配任意單字元。
pattern\{n\}:只用來匹配前面pattern出現的次數.n為次數。如a\{2\}匹配aa.
pattern\{n,\}:含義同上,但次數最少為n.如a\{2,\}匹配aa,aaa,aaaa,.....
pattern\{n,m\}:含義同上,但次數在n和m之間。如a\{2,4\}匹配aa,aaa,aaaa三個
(3)舉例說明:
^$ :匹配空行
^.$ :匹配包含一個字元的行
\*\.pas :匹配以*.pas結尾的所有字元或文件
[0123456789]或[0-9] :假定要匹配任意一個數字
[a-z] :任意小寫字母
[A-Za-z] :任意大小寫字母
[S,s] :匹配大小寫S
[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\} :匹配IP地址 [0-9]\{3\}三個0-9組成的字元串;\. :匹配點(注意這里點是特殊的字元,所以要用"\"來屏蔽其含義)
2.find介紹
(1)查找具有某些特徵文件的命令,可遍歷當前目錄甚至於整個文件系統來查看某些文件或目錄,其遍歷大的文件系統時一般放在後台執行。
(2)find命令的一般形式
find pathname -options [-print -exec -ok]
-pathname :find命令所查找的目錄路徑。如用"."來表示當前的目錄,用/來表示系統根目錄
-print :find命令將匹配的文件輸出到標准輸出
-exec: find命令對匹配的文件執行該參數所給出的shell命令,相應的命令形式為
'command'{} \; (注意{}和\之間的空格)
-ok 和 -exec的作用相同,只不過以一種更為安全的模式來執行該參數所給出的shell命令,在執行每一個命令之前,都會給出提示,讓用戶來確定是否執行。
options有如下幾種:
-name :按照文件名查找文件
-perm :按照文件許可權來查找文件
-user :按照文件屬主來查找文件
-group :按照文件所屬的組來查找文件
-mtime -n +n 按照文件的更改時間來查找文件,-n表示文件更改時間距現在n天以內,+n表示文件更改時間距現在n天以前。find命令還有-atime 和-ctime選項,但它們都和-mtime選項相似。
-size n[c]查找文件長度為n塊的文件,帶有c時表示文件長度以位元組計。
-nogroup 查找無有效所屬組的文件,即該文件所屬的組在/etc/groups中不存在
-newer file1 !file2查找更改時間比文件file1新但比文件file2舊的文件
-depth 先查找指定目錄有無匹配文件,若無則再在子目錄中查找
-type 查找某一類型的文件,如
b :塊設備文件
d:目錄
e:字元設備文件
p;管道文件
l:符號鏈接文件
f:普通文件
(3)find命令舉例
find -name "*.txt" -print 查找txt結尾的文件並輸出到屏幕上
find /cmd ".sh" -print 查找/cmd目錄下所有sh文件,並輸出
find . -perm 755 -print 查找當前目錄下許可權為755的文件,並輸出
find `pwd` -user root -print 查找當前目錄下屬主為root的文件,並輸出
find ./ -group sunwill -print 查找當前目錄下所屬主是sunwill的文件
find /var -mtime -5 -print 查找/var目錄下更改時間為5天內的所有文件
find /var -mtime +5 -print 查找/var目錄下更改時間為5天以前的所有文件
find /var -newer "myfile1" ! -newer "myfile2" -print 查找/var目錄下比myfile1新,但是比myfile2舊的所有文件。
find /var -type d -print 查找/var目錄下所有目錄
find /var -type l -print 查找/var目錄下所有的符號鏈接文件。
find . -size +1000000c -print 查找當前目錄下大於1000000位元組的文件
find / -name "con.file" -depth -print 查找根目錄下有無"con.file",若無則在其子目錄中查找
find . -type f -exec ls -l {} \; 查找當前目錄下是否有普通文件,若有則執行ls -l
(4)xargs命令
在 使用find命令的-exec選項處理匹配到的文件時,find命令將所有匹配到的文件一起傳遞給exec。不幸的是,有些系統對能夠傳遞給exec的命 令長度有限制,這樣find命令運行幾分鍾之後就算出現溢出錯誤。錯誤信息通常是「參數列太長」或「參數列溢出」。這就是xargs的用處所在,特別是與 find命令一起使用,exec會發起多個進程,而xargs會多個,只有一個
find ./ -perm -7 -print | xargs chmod o-w 查找許可權為7的文件並傳遞給chmod處理
3.grep介紹
(1)grep 的一般格式為 grep [options] 基本正則表達式 [文件]
字元串參數最好採用是雙引號括,一是以防被誤解為shell命令,二是可以用來查找多個單片語成的字元串
-c:只輸出匹配行的記數
-i:不區分大小寫(只適用於單個字元)
-h:查詢多個文件時不顯示文件名
-H:只顯示文件名
-l:查詢多文件時只輸出包含匹配字元的文件名
-n:只顯示匹配行及其行號
-s:不顯示不存在或無匹配文本的錯誤信息。
-v:顯示不包含匹配文本的所有行。
(2)舉例說明:
grep ^[^210] myfile 匹配myfile中以非2、1、0開頭的行
grep "[5-8][6-9][0-3]" myfile 匹配myfile中第一位為5|6|7|8,第二位6|7|8|9,第三位為0|1|2|3的三個字元的行
grep "4\{2,4\}" myfile 匹配myfile中含有44,444或4444的行
grep "\?" myfile匹配myfile中含有任意字元的行
(3)grep命令類名
[[:upper:]] 表示[A-Z]
[[:alnum:]] 表示[0-9a-zA-Z]
[[:lower:]] 表示[a-z]
[[:space:]] 表示空格或者tab鍵
[[:digit:]] 表示[0-9]
[[:alpha:]] 表示[a-zA-Z]
如:grep "5[[:digit:]][[:digit:]]" myfile 匹配myfile中含有5開頭接下去兩位都是數字的行。
4.awk介紹
可以從文件或字元串中基於指定規則瀏覽和抽取信息,是一種自解釋的變成語言。
(1)awk命令行方式 awk [-F filed-spearator] 'command' input-files
awk腳本:所有awk命令插入一個文件,並使awk程序可執行,然後用awk命令解釋器作為腳本的首行,以便通過鍵入腳本名稱來調用它。awk腳本是由各種操作和模式組成。
模式部分決定動作語句何時觸發及觸發事件。(BEGIN,END)
動作對數據進行處理,放在{}內指明(print)
(2)分隔符、域和記錄
awk執行時,其瀏覽域標記為$1,$2,...$n.這種方法成為域標識。$0為所有域。
(3)舉例說明:
awk '{print $0}' test.txt |tee test.out 輸出test.txt中所有行$0表示所有域
awk -F : '{print $1} test.txt |tee test.out' 同上。。只是分隔符為":"
awk 'BEGIN {print "IPDate\n"}{print $1 "\t" $4} END{print "end-of-report"}' test.txt
開始時列印「IPDate」結束時列印「end-of-report」中間列印主體信息,比如總共匹配三條信息,則輸出如下:
IPDate
1 first
2 second
3 third
end-of-report
(4)匹配操作符 ~ 匹配,!~ 不匹配
cat test.txt |awk '$0~/210.34.0.13/' 匹配test.txt中為210.34.0.13的行
awk '$0!~/210.34.0.13' test.txt 匹配test.txt中不是210.34.0.13的行
awk '{if($1=="210.34.0.13") print $0}' test.txt 匹配 test.txt中第一個域為210.34.0.13的行。
5.sed介紹
sed不與初始化文件打交道,它操作的只是一個拷貝,然後所有的改動如果沒有重定向到一個文件,將輸出到屏幕。
sed是一種很重要的文本過濾工具,使用一行命令或者使用管道與grep與awk相結合。是一種非交互性文本流編輯。
(1)調用sed的三種方式
使用sed命令行格式為:sed [options] sed命令 輸入文件
使用sed腳本文件格式為:sed[options] -f sed腳本文件 輸入文件
sed腳本文件[options] 輸入文件
--不管是使用shell命令行方式或腳本文件方式,如果沒有指定輸入文件,sed從標准輸入中接受輸入,一般是鍵盤或重定向結果。
(2)sed 命令的options如下
-n:不列印
-c:下一命令是編輯命令
-f:如果正在調用sed腳本文件
(3)sed在文件中查詢文本的方式
--使用行號,可以是一個簡單的數字,或是一個行號的范圍
--使用正則表達式
(4)讀取文本的方式
x x為一行號
x,y 表示行號范圍從x到y
/pattern/ 查詢包含模式的行
/pattern/pattern/ 查詢包含兩個模式的行
pattern/,x 在給定的行號上查詢包含模式的行
x,/pattern/ 通過行號和模式查詢匹配行
x,y! 查詢不包含指定行號x和y的行
(5)基本sed編輯命令
p 列印匹配行
d 刪除匹配行
= 顯示文件行號
a\ 在定位行號後附加新文本信息
i\ 在定位行號後插入新文本信息
c\ 用新文本替換定位文本
s 使用替換模式替換相應模式
r 從另一個文件中讀文件
w 寫文本到一個文件
q 第一個模式匹配完成後推出或立即退出
l 顯示與八禁止ASCII代碼等價的控制字元
{} 在定位行執行的命令組
n 從另一個文件中讀文本下一行,並附加在下一行
g 將模式2粘貼到/pattern n/
y 傳送字元
(6)舉例說明:
sed -n '2p' test.txt 列印第二行的信息(注意:-n是不列印不匹配的信息,若沒加-n,則列印文件的所有信息而不是匹配信息)
sed -n '1,4p' test.txt 列印第一行到第四行的信息
sed -n '/los/p' test.txt模式匹配los,並列印出來
sed -n '2,/los/p' test.txt 從第二行開始。。知道匹配第一個los
sed -n '/^$/p' test.txt 匹配空行
sed -n -e '/^$/p' -e '/^$/=' test.txt 列印空行及行號
sed -n '/good/a\morning' test.txt 在匹配到的good後面附加morning
sed -n '/good/i\morning' test.txt 在匹配到的good前面插入morning
sed -n '/good/c\morning' test.txt 將匹配到的good替換成morning
sed '1,2d' test.txt 刪除第1和2行
sed 's/good/good morning/g' test.txt 匹配good並替換成goodmorning
send 's/good/& hello /p' test.txt 匹配到good就在其後面加上hello
send 's/good/ hello &/p' test.txt 匹配到good就在其前面加上hello
6.合並與分割(sort,uniq,join,cut,paste,split)
(1)sot命令
sort [options] files 許多不同的域按不同的列順序排序
-c 測試文件是否已經排序
-m 合並兩個排序文件
-u 刪除所有同樣行
-o 存儲sort結果的輸出文件名
-t 域分隔符,用非空格或tab開始排序
+n :n 為列號,使用此列號開始排序
-n 指定排序是域上的數字分類項
-r 比較求逆
sort -c test.txt 測試文件是否分類過
sort -u test.txt 排序並合並一樣的行
sort -r test.txt 以相反的順序排列
sort -t "/" +2 test.txt 以"/"分隔,第二個域開始分類
(2)uniq命令
uniq [options ] files 從一個文本文件中去除或禁止重復行
-u 只顯示不重復行
-d 只顯示有重復數據行,每種重復行只顯示其中一行
-c 列印每一重復行出現次數
-f :n為數字,前n個域被忽略
uniq -f 2 test.txt 忽略前2個域
(3)join 命令
join [options] file1 file2 用來將來自兩個分類文本文件的行連在一起
-an,n為一數字,用於連接時從文件n中顯示不匹配行
-onm ,連接域,n為文件號,m為域號
-jnm,n為文件號,m為域號,使用其他域作連接域
-t ,域分隔符。用來設置非空格或tab鍵的域分隔符。
(4)split命令
split -output_file_size intput_filename output_filename
用來將大文件分割成小文件。
-b n,每個分割文件的大小n
-C n,每個分割文件一行最多n位元組
-l n,每個分割文件的行數
-n,同-l n
split -10 test.txt 將test.txt分割成10行的小文件
(5)cut 命令
cut -c n1-n2 filename 顯示每行從開頭算起 n1 到 n2 的文字。
cut -c 3-5 test.txt 顯示test.txt中每行從第3到第5個字元
Linux查找文件內容的常用命令方法:

1、從文件內容查找匹配指定字元串的行:
$ grep "被查找的字元串" 文件名

2、從文件內容查找與正則表達式匹配的行:
$ grep –e 「正則表達式」 文件名

3、查找時不區分大小寫:
$ grep –i "被查找的字元串" 文件名

4、查找匹配的行數:
$ grep -c "被查找的字元串" 文件名

5、從文件內容查找不匹配指定字元串的行:
$ grep –v "被查找的字元串" 文件名

6、從根目錄開始查找所有擴展名為.log的文本文件,並找出包含」ERROR」的行
find / -type f -name "*.log" | xargs grep "ERROR"

7、例子 :查找/SqLogs/access.log文件中包含".exe" 或者"TCP_DENIED"的記錄
方法1:grep /SqLogs/access.log –e ".exe」
grep /SqLogs/access.log –e "TCP_DENIED」
方法2:find /SqLogs –type f –name access.log | xargs grep ".exe"
find /SqLogs –type f –name access.log | xargs grep "TCP_DENIED"
因為公司是通過SQUID代理伺服器共享上網的,有時候因為某些原因,新版本的應用程序或者財務報稅軟體會無法使用,所以只有查看 access.log文件,查找原因!由於LOG文件太大了,雖然每天都執行壓縮重建LOG文件,但幾十M的LOG文件里的內容太多,直接打開查看再查找很浪費時間,也很麻煩!之前用
tail –n 100 /SqLogs/access.log命令找起來也很麻煩,上面的兩個命令幫了我很大的忙,很短的時間就可以幫我找到問題所在!分享給大家!

I. linux分割文件test.txt分別儲存兩個文件里

摘要 您好,linux下文件分割可以通過split命令來實現,可以指定按行數分割和安大小分割兩種模式。Linux下文件合並可以通過cat命令來實現,非常簡單。

J. linux split怎麼根據"\"進行分割

將一個大文件分成若干個小文件方法
例如將一個BLM.txt文件分成前綴為 BLM_ 的1000個小文件,後綴為系數形式,且後綴為4位數字形式
先利用
wc -l BLM.txt 讀出 BLM.txt 文件一共有多少行
再利用 split 命令
split -l 2482 ../BLM/BLM.txt -d -a 4 BLM_
將 文件 BLM.txt 分成若干個小文件,每個文件2482行(-l 2482),文件前綴為BLM_ ,系數不是字母而是數字(-d),後綴系數為四位數(-a 4)

閱讀全文

與linux中split命令相關的資料

熱點內容
linux修改網卡配置 瀏覽:913
雲伺服器和本地伺服器數據 瀏覽:843
在家如何創業python 瀏覽:222
編譯原理好課 瀏覽:716
python中實數的表示 瀏覽:370
php下載中文名文件 瀏覽:348
哪裡有專門注冊app實名的 瀏覽:273
魔爪mx穩定器app去哪裡下載 瀏覽:469
excel如何批量處理電話號碼加密 瀏覽:324
ark命令 瀏覽:40
seal是不是對稱密鑰演算法 瀏覽:30
免費學習的app在哪裡下載 瀏覽:177
rfid與單片機 瀏覽:590
5s相當於安卓什麼手機 瀏覽:690
哈佛商學院pdf 瀏覽:978
app的ip哪裡買 瀏覽:909
移動天文台app在哪裡下載 瀏覽:924
phpjsonencode亂碼 瀏覽:588
t3的伺服器名是什麼幾把 瀏覽:69
高中演算法語句 瀏覽:549