Kā konvertēt PDF failu uz rediģējamu tekstu, izmantojot komandrindu Linux

Kā konvertēt PDF failu uz rediģējamu tekstu, izmantojot komandrindu Linux
Kā konvertēt PDF failu uz rediģējamu tekstu, izmantojot komandrindu Linux

Video: Kā konvertēt PDF failu uz rediģējamu tekstu, izmantojot komandrindu Linux

Video: Kā konvertēt PDF failu uz rediģējamu tekstu, izmantojot komandrindu Linux
Video: 7 Ways To Adjust the Colors On Your Mac's Screen - YouTube 2024, Aprīlis
Anonim
Pastāv vairāki iemesli, kāpēc jūs varētu vēlēties PDF failu pārveidot par rediģējamu tekstu. Varbūt jums ir jāpārskata vecais dokuments, un viss, kas jums ir, ir tā PDF versija. PDF failu pārvēršana sistēmā Windows ir vienkārša, bet, ja jūs lietojat Linux?
Pastāv vairāki iemesli, kāpēc jūs varētu vēlēties PDF failu pārveidot par rediģējamu tekstu. Varbūt jums ir jāpārskata vecais dokuments, un viss, kas jums ir, ir tā PDF versija. PDF failu pārvēršana sistēmā Windows ir vienkārša, bet, ja jūs lietojat Linux?

Neuztraucies. Mēs parādīsim, kā viegli konvertēt PDF failus uz rediģējamu tekstu, izmantojot komandrindas rīku pdftotext, kas ir daļa no poppler-utils paketes. Šis rīks jau ir instalēts. Lai pārbaudītu, vai jūsu sistēmā ir instalēta pdftotext, nospiediet taustiņu kombināciju Ctrl + Alt + T, lai atvērtu termināla logu. Uzvednē ierakstiet šādu komandu un nospiediet "Enter".

dpkg –s poppler-utils

PIEZĪME. Kad mēs saka, ka šajā rakstā kaut ko ierakstiet, un tekstā ir citāti, NEDRĪKST ievadiet citātus, ja vien mēs nenorādīsim citādi.

Ja pdftotext nav instalēts, uzvednē ierakstiet šādu komandu un nospiediet "Enter".
Ja pdftotext nav instalēts, uzvednē ierakstiet šādu komandu un nospiediet "Enter".

sudo apt-get install poppler-utils

Ievadiet savu paroli pēc uzvednes un nospiediet "Enter".

Poppler-utils paketē ir vairāki rīki, kas ļauj pārveidot PDF dažādos formātos, manipulēt ar PDF failiem un iegūt informāciju no failiem.
Poppler-utils paketē ir vairāki rīki, kas ļauj pārveidot PDF dažādos formātos, manipulēt ar PDF failiem un iegūt informāciju no failiem.
Tālāk ir norādīta pamatdaļa PDF faila pārveidošanai rediģējamā teksta failā. Nospiediet "Ctrl + Alt + T", lai atvērtu Terminal logu, ierakstiet komandu uz uzvednes un nospiediet "Enter".
Tālāk ir norādīta pamatdaļa PDF faila pārveidošanai rediģējamā teksta failā. Nospiediet "Ctrl + Alt + T", lai atvērtu Terminal logu, ierakstiet komandu uz uzvednes un nospiediet "Enter".

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Mainiet ceļu uz katru failu, lai tas atbilstu sākotnējā PDF faila atrašanās vietai un nosaukumam un kur vēlaties saglabāt iegūto teksta failu. Arī nomainiet failu nosaukumus, lai tie atbilstu jūsu failu nosaukumiem.

Teksta fails ir izveidots un to var atvērt, tāpat kā Linux atverot jebkuru citu teksta failu.
Teksta fails ir izveidots un to var atvērt, tāpat kā Linux atverot jebkuru citu teksta failu.
Pārveidotajā tekstā var būt līniju pārtraukumi vietās, kurās nevēlaties. Līniju pārtraukumi tiek ievietoti PDF failā pēc katras teksta rindiņas.
Pārveidotajā tekstā var būt līniju pārtraukumi vietās, kurās nevēlaties. Līniju pārtraukumi tiek ievietoti PDF failā pēc katras teksta rindiņas.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Ja vēlaties tikai pārvērst lappušu diapazonu PDF failā, izmantojiet karodziņus "-f" un "-l" (mazo burtu "L"), lai norādītu pirmo un pēdējo lappuses diapazonā, kuru vēlaties konvertēt.
Ja vēlaties tikai pārvērst lappušu diapazonu PDF failā, izmantojiet karodziņus "-f" un "-l" (mazo burtu "L"), lai norādītu pirmo un pēdējo lappuses diapazonā, kuru vēlaties konvertēt.

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Lai konvertētu PDF failu, kas ir aizsargāts un šifrēts ar īpašnieka paroli, izmantojiet karodziņu "-opw" (pirmais rakstzīme karodziņā ir mazā burts "O", nevis nulle).
Lai konvertētu PDF failu, kas ir aizsargāts un šifrēts ar īpašnieka paroli, izmantojiet karodziņu "-opw" (pirmais rakstzīme karodziņā ir mazā burts "O", nevis nulle).

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Mainiet "paroli" tā, kuru izmanto, lai aizsargātu sākotnējo PDF failu, kas tiek konvertēts. Pārliecinieties, vai par "paroli" ir vienas kotācijas, nevis dubultās.

Ja PDF fails ir aizsargāts un šifrēts ar lietotāja paroli, izmantojiet karodziņu "-opw", nevis karodziņu "-opw". Pārējās komandas ir vienādas.
Ja PDF fails ir aizsargāts un šifrēts ar lietotāja paroli, izmantojiet karodziņu "-opw", nevis karodziņu "-opw". Pārējās komandas ir vienādas.
Varat arī norādīt, kāda veida beigas-line rakstzīme tiek izmantota pārveidotajam tekstam. Tas ir īpaši noderīgi, ja plānojat piekļūt failam citā operētājsistēmā, piemēram, Windows vai Mac. Lai to izdarītu, izmantojiet karodziņu "-eol" (karodziņa vidējais raksturs ir mazā burts "O", nevis nulle), kam seko atstarpe un izmantojamā beigu līnija, kuru vēlaties izmantot (" unix "," dos "vai" mac ").
Varat arī norādīt, kāda veida beigas-line rakstzīme tiek izmantota pārveidotajam tekstam. Tas ir īpaši noderīgi, ja plānojat piekļūt failam citā operētājsistēmā, piemēram, Windows vai Mac. Lai to izdarītu, izmantojiet karodziņu "-eol" (karodziņa vidējais raksturs ir mazā burts "O", nevis nulle), kam seko atstarpe un izmantojamā beigu līnija, kuru vēlaties izmantot (" unix "," dos "vai" mac ").
PIEZĪME. Ja teksta faila nosaukumu nenosaka, pdftotext automātiski izmanto PDF faila nosaukuma bāzi un pievieno paplašinājumu.txt. Piemēram, "file.pdf" tiks konvertēts uz "file.txt". Ja teksta fails ir norādīts kā "-", pārveidotais teksts tiek nosūtīts uz stdout, kas nozīmē, ka teksts tiek parādīts Terminal logā un nav saglabāts failā.
PIEZĪME. Ja teksta faila nosaukumu nenosaka, pdftotext automātiski izmanto PDF faila nosaukuma bāzi un pievieno paplašinājumu.txt. Piemēram, "file.pdf" tiks konvertēts uz "file.txt". Ja teksta fails ir norādīts kā "-", pārveidotais teksts tiek nosūtīts uz stdout, kas nozīmē, ka teksts tiek parādīts Terminal logā un nav saglabāts failā.

Lai aizvērtu Terminal logu, noklikšķiniet uz pogas "X" augšējā kreisajā stūrī.

Lai iegūtu papildinformāciju par komandu pdftotext, termināļa logā uzvednē ierakstiet "man page pdftotext".

Ieteicams: