UNIX中的文件切割
UNIX的SHELL功能強大,非Windows可比,從上面使用的TAR、FTP已可管窺。同樣,UNIX已經提供了文件切割功能,不需要費力氣去尋找第三方的文件切割程序。能完成這個功能的UNIX命令就是DD。
要切割的大文件為DGJD,共98336321字節,則:
dd if=dgjd of=zz1 bs=1 count=20000000 dd if=dgjd of=zz2 bs=1 count=20000000 skip=20000000 dd if=dgjd of=zz3 bs=1 count=20000000 skip=40000000 dd if=dgjd of=zz4 bs=1 count=20000000 skip=60000000 dd if=dgjd of=zz5 bs=1 count=18336321 skip=80000000
其中IF(INPUT FILENAME)是要切割的大文件名,OF(OUTPUT FILENAME)是切割后的子文件名,BS是指明以多少字節作為一個切割記錄單位,COUNT是要切割的單位記錄數,SKIP是說明切割時的起點,單位同樣以BS設定值為準。通過上述五條指令就將DGJD大文件切割成為4個2千萬字節、1個18336321字節的子文件。要注意的是SKIP的值不能錯。 由此也不難看出,DD切割是“非損耗”式的切割,并且支持從任意位置開始的任意大小的切割。
要將生成的ZZ1、ZZ2、ZZ3、ZZ4四個子文件組裝為XDGJD,則:
dd if=zz1 of=xdgjd bs=1 count=20000000 dd if=zz2 of=xdgjd bs=1 count=20000000 seek=20000000 dd if=zz3 of=xdgjd bs=1 count=20000000 seek=40000000 dd if=zz4 of=xdgjd bs=1 count=20000000 seek=60000000 dd if=zz5 of=xdgjd bs=1 count=18336321 seek=80000000
其中SKIP參數改為SEEK參數,指明組裝的新大文件XDGJD每次的開始位置是從文件頭開始多少字節。如果缺省,則組裝從文件頭開始,顯然這不是我們每次都希望的, 所以需用SEEK參數明確指出開始位置。通過以上5個指令,即可將5個子文件重新組裝為一個大文件。
將切割后生成的子文件重新用FTP傳送,結果有的能夠順利傳送, 有的仍然導致網絡癱瘓,不怕,繼續切割,切成每個一千萬字節,再傳,OK!成功傳送!
測試表明,每次傳送的文件最好小于12M字節,否則可能導致網絡故障。另外,DD這個命令最初是為了進行編碼轉換而設計的,用于在大型機中將EBCDIC字符代碼轉換為ASCII代碼,但此功能已不常用,現在DD成了文件系統備份的工具,以及做一些類似文件切割的“另類業務”,正所謂“有心栽花花不開,無心插柳柳成蔭”,不過對于用戶來說,重要的是軟件能否完成自己需要的功能,它的“本職工作”是什么并不重要,“不管白貓黑貓,捉住老鼠就是好貓”!實用為本,軟件的生命力就在于實用。
