你曾经是否想要把一个大文件分割成多个小文件?比如一个5gb日志文件,我们需要把它分成多个小文件,这样我们才有可能使用普通的文本编辑器读取它。有时我们需要传输20gb的大文件到另一台服务器,这就需要我们把它分割成多个文件,这样便于传输数据。下面我们来通过五个实例来讲解它。
split命令分割文件成每个文件1000行,并且文件名依次为 [前缀]aa, [前缀]ab, [前缀]ac等,默认的前缀是X,每个文件的行数为1000行,命令如下:
$ split mylog $ wc -l * 4450 mylog 1000 xaa 1000 xab 1000 xac 1000 xad 450 xae
分割文件为多个20MB的文件,附带-b选项命令如下:
$ split -b 20M logdata $ ls -lh | tail -n +2 -rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad -rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae -rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf
使用–bytes选项把文件分割成多个50MB的文件,–bytes类似-b选项,在第二个参数指定前缀。
$ split --bytes=50M logdata mydatafile $ ls -lh total 204M -rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata -rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa -rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab -rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac
使用-l选项指定行数来把文件分割成多个行数相同的文件。
$ wc -l testfile 2591 testfile $ split -l 1500 testfile importantlog $ wc -l * 1500 importantlogaa 1091 importantlogab 2591 testfile
使用-d选项可以指定后缀为数字,如00,01,02..,而不是aa,ab,ac。
$ split -d testfile $ ls testfile x00 x01 x02