Guide
Manipolare Gratuitamente i PDF
Published by Rafanto on 19/12/2006 (3293 reads)
Premetto che questa guida non è mia , voglio solo riportarla fedelmente come l'originale e indicando la sorgente.
Questa guida si occupa della gestione dei pdf .. totalmente in modo gratuito.
Manipolare PDF facilmente e… gratuitamente!
link:
http://lateralthinking.wordpress.com/2006/11/04/manipolare-pdf-facilmente-e-gratuitamente/
Volete assolutamente poter manipolare questo o quel PDF che vi interessa tanto.
Avete provato di tutto: gs, kpdftool ed anche programmi proprietari, senza ottenere risultati soddisfacenti o scoprendo che il programma in questione ha ignorato questa o quella pagina.
Niente paura, avete bisogno soltanto di tre strumenti:
- teTeX (utenti Fedora: installate anche tetex-latex, che è meglio)
- Perl
- poppler (utenti Fedora: installate anche poppler-utils)
Sicuramente esistono già dei pacchetti precompilati per la vostra distro preferita.
Questo breve howto vi illustra come potete effettuare le operazioni più comunti con queste utility sui documenti pdf (estrazione test, figure, pagine, concatenazione ed altro.)
Prima di iniziare, tenete contro che ognuna di queste applicazioni ha un certo numero di opzioni. Visitate la pagina del manuale di ognuna per avere una visione d’insieme più completa.
* Estrarre testo da un pdf
Pacchetto: poppler
Eseguite:
$ pdftotext [testooutput]
Il file sarà convertito in testo semplice in [testooutput].
* Estrarre immagini da un pdf
Pacchetto: poppler
$ pdfimages
Potete specificare un range di pagine che il programma deve considerare con le opzioni -f (per prima pagina) -l (per ultima pagina.) Le immagini in formato jpg saranno mantenute in jpg; le altre saranno convertite in ppm o pbm.
* Estrarre pagine da un pdf
Pacchetto: teTeX
texexec --pdfarrange [--paper=] --pages=PAGENUMBERLIST [–result ]
Dove PAGENUMBERLIST può essere:
- numeri di pagine, separate da una virgola
- un range di pagine, separando i limiti con un : (ad esempio, da pagina 2 a pagina 6: 2:6)
- pagine destre (cioè dispari) con odd
- pagine sinistre (cioè pari) con even
- una combinazione delle predenti, separate da una virgola
* Convertire pdf
A parte la conversione in testo; potete anche convertire i pdf nei seguenti formati:
Postscript: con pdftops [file_ps_in_output]
HTML: con pdftohtml -c
Immagini PPM: con pdftoppm [file_ppm_in_output]
* Modificare pdf
Potete convertire i file pdf in html, modificarli e riconvertirli in pdf
Quest’ultima operazione si può fare semplicemente stampandoli in un file .ps e convertendoli in .pdf con ps2pdf; oppure scaricando ed usando l’intuitivo programma htmldoc.
* Concatenare pdf
Pacchetto: teTeX
$ texexec --pdfarrange [--mode=TIPOCARTA] [–paper=CONVERSIONE_FORMATO] [–result vostro_pdf_in_output] [lista_pdf_successivi]
Dove:
TIPOCARTA è il formato della carta (A4, letter, screen)
CONVERSIONE_FORMATO può essere uno dei tipi di TIPOCARTA oppure a4a3 o a5a4
* Reimpaginare pdf
Potete dunque usare il comando precedente per cambiare anche il formato delle pagine dei vostri pdf.
Vi ricordo che la sorgente della seguente guida è:
http://lateralthinking.wordpress.com/2006/11/04/manipolare-pdf-facilmente-e-gratuitamente/
Questa guida si occupa della gestione dei pdf .. totalmente in modo gratuito.
Manipolare PDF facilmente e… gratuitamente!
link:
http://lateralthinking.wordpress.com/2006/11/04/manipolare-pdf-facilmente-e-gratuitamente/
Introduzione
Volete assolutamente poter manipolare questo o quel PDF che vi interessa tanto.
Avete provato di tutto: gs, kpdftool ed anche programmi proprietari, senza ottenere risultati soddisfacenti o scoprendo che il programma in questione ha ignorato questa o quella pagina.
Niente paura, avete bisogno soltanto di tre strumenti:
- teTeX (utenti Fedora: installate anche tetex-latex, che è meglio)
- Perl
- poppler (utenti Fedora: installate anche poppler-utils)
Sicuramente esistono già dei pacchetti precompilati per la vostra distro preferita.
Questo breve howto vi illustra come potete effettuare le operazioni più comunti con queste utility sui documenti pdf (estrazione test, figure, pagine, concatenazione ed altro.)
Prima di iniziare, tenete contro che ognuna di queste applicazioni ha un certo numero di opzioni. Visitate la pagina del manuale di ognuna per avere una visione d’insieme più completa.
* Estrarre testo da un pdf
Pacchetto: poppler
Eseguite:
$ pdftotext
Il file
* Estrarre immagini da un pdf
Pacchetto: poppler
$ pdfimages
Potete specificare un range di pagine che il programma deve considerare con le opzioni -f (per prima pagina) -l (per ultima pagina.) Le immagini in formato jpg saranno mantenute in jpg; le altre saranno convertite in ppm o pbm.
* Estrarre pagine da un pdf
Pacchetto: teTeX
texexec --pdfarrange [--paper=
Dove PAGENUMBERLIST può essere:
- numeri di pagine, separate da una virgola
- un range di pagine, separando i limiti con un : (ad esempio, da pagina 2 a pagina 6: 2:6)
- pagine destre (cioè dispari) con odd
- pagine sinistre (cioè pari) con even
- una combinazione delle predenti, separate da una virgola
* Convertire pdf
A parte la conversione in testo; potete anche convertire i pdf nei seguenti formati:
Postscript: con pdftops
HTML: con pdftohtml -c
Immagini PPM: con pdftoppm
* Modificare pdf
Potete convertire i file pdf in html, modificarli e riconvertirli in pdf
Quest’ultima operazione si può fare semplicemente stampandoli in un file .ps e convertendoli in .pdf con ps2pdf; oppure scaricando ed usando l’intuitivo programma htmldoc.
* Concatenare pdf
Pacchetto: teTeX
$ texexec --pdfarrange [--mode=TIPOCARTA] [–paper=CONVERSIONE_FORMATO] [–result vostro_pdf_in_output]
Dove:
TIPOCARTA è il formato della carta (A4, letter, screen)
CONVERSIONE_FORMATO può essere uno dei tipi di TIPOCARTA oppure a4a3 o a5a4
* Reimpaginare pdf
Potete dunque usare il comando precedente per cambiare anche il formato delle pagine dei vostri pdf.
Vi ricordo che la sorgente della seguente guida è:
http://lateralthinking.wordpress.com/2006/11/04/manipolare-pdf-facilmente-e-gratuitamente/
|
I commenti sono proprietà dei rispettivi autori. Non siamo in alcun modo responsabili del loro contenuto.
|
||||







