Sadalīt teksta failu pusē (vai jebkura procentuālā daļa) Ubuntu Linux

Sadalīt teksta failu pusē (vai jebkura procentuālā daļa) Ubuntu Linux
Sadalīt teksta failu pusē (vai jebkura procentuālā daļa) Ubuntu Linux

Video: Sadalīt teksta failu pusē (vai jebkura procentuālā daļa) Ubuntu Linux

Video: Sadalīt teksta failu pusē (vai jebkura procentuālā daļa) Ubuntu Linux
Video: Dolly 2.0 : Free ChatGPT-like Model for Commercial Use - How To Install And Use Locally On Your PC - YouTube 2024, Aprīlis
Anonim

Ja jums ir nepatīkams teksta fails, kuru mēģināt apstrādāt, dažreiz sadaļas var sadalīt laiku, jo īpaši, ja mēs gatavojamies importēt failu izklājlapā. Vai arī jūs vēlaties vienkārši iegūt noteiktu rindu kopu no faila.

Ievadiet split, wc, astes, kaķa un grep. (neaizmirstiet sed un awk). Linux satur bagātīgu komunālo pakalpojumu komplektu, kas paredzēts komandrindas darbam ar teksta failiem. Mūsu uzdevumam šodien mēs izmantosim split un wc.

Vispirms apskatīsim mūsu žurnāla failu ….

> ls -l -rw-r–r– 1 thegeek ggroup 42046520 2006-09-19 11:42 access.log

Mēs redzam, ka faila lielums ir 42 MB. Tas ir kaut kas liels … bet cik daudz līniju mēs esam nodarbojušies? Ja mēs vēlētos to importēt programmā Excel, mums vajadzētu saglabāt to mazāk nekā 65 k līnijas.

Pārbaudīsim rindu skaitu failā, izmantojot wc utilītu, kas nozīmē "vārdu skaits".

> wc -l access.log 146330 access.log

Mēs esam pāri mūsu ierobežojumam. Mums būs jāsadala tas 3 segmentos. Lai to paveiktu, mēs izmantosim split utilītu.

> split -l 60000 access.log > ls -l

total 79124 -rw-rw-r– 1 thegeek ggroup 40465200 2006-09-19 12:00 access.log -rw-rw-r– 1 thegeek ggroup 16598163 2006-09-19 12:05 xaa -rw-rw-r– 1 thegeek ggroup 16596545 2006-09-19 12:05 xab -rw-rw-r– 1 thegeek ggroup 7270492 2006-09-19 12:05 xac

Tagad esam sadalījuši savus teksta failus 3 atsevišķos failos, no kuriem katrā ir mazāk nekā 60000 rindiņu, un tas šķita labs skaits, ko izvēlēties. Pēdējā failā ir atlikušā summa. Ja jūs gatavojaties samazināt šo konkrēto failu pusi, jūs to izdarītu:

> split -l 73165 access.log

Un tas viss ir tā.

Ieteicams: