Manipular PDFs con pdftk

Por una infinidad de razones no he podido escribir para el blog (principalmente por andar redactando una condenada tesis). Hoy decidí escribir algo que me he pasado leyendo últimamente:  PDFs (bueno, digamos que también me la he pasado “produciendo” PDFs pues casi todo lo que escribo lo produzco en \LaTeX, sistema -y lenguaje anotado/markup- que compila nada más y nada menos que eso,  archivos tipo “Portable Document Format”).  Al parecer, además de imprimir, subrayar y anotar, es muy poco lo que uno puede hacer con PDFs. Por ejemplo, especialmente si uno no tiene Adobe Acrobat PRO o uno de esos programas caros, es difícil borrar palabras del documento, poner una marca de agua, etc.

Resulta que esto que digo no es “tan” cierto. Encontré un programa llamado The PDF Toolkit (pdftk) que es muy sencillo de usar y, mejor aún, es gratis. Aquí voy a dejarles un ejemplo muy sencillo aunque, confieso, se pueden hacer muchas cosas más con este dichoso programa (yo, por ejemplo, utilicé pdftk y un “loop” en la shell de Unix para poner una marca de agua con mi nombre y correo electrónico a unos 600 archivos .pdf que tuve que compartir con alguien). Si tienen una Mac -que es lo que yo usé- una vez instalado el programa (siguiendo las instrucciones del link de aquí arriba) abran la Terminal en su Mac y tecleen pdftk. Si instalaron el programa correctamente, después de teclear pdftk la Terminal responderá con una sinopsis de lo que puede hacer este programa.

En mi ejemplo voy a combinar dos documentos PDF en uno solo (si quieren combinar más documento pueden usar comodines en la Terminal como, por ejemplo, *.pdf si quieren llamar todos los archivos .pdf que se encuentren en el directorio en el que se encuentren o prueba*.pdf si quieren llamar archivos llamados prueba1.pdf, prueba2.pdf, incluso pruebaTEXTO.pdf, etc.). Aquí combinaré el PDF de un Stata News reciente (aquí el link al PDF por si quieren seguir el ejemplo) con el manual para el lector de libros electrónicos Kindle (por acá el link). Para el ejemplo deben seguir en la Terminal pues pdftk funciona desde ahí (aquí encontrarán algunos comandos útiles para utilizar en la Terminal). Ambos PDFs los tengo en mi escritorio y el objetivo sería obtener un documento adicional que llamaré “Combinado.pdf”, también en el escritorio. Así, lo primero sería decirle a la Terminal que vaya al directorio de mi escritorio y, una vez ahí, pedirle que con pdftk combine los documentos. Aquí los 2 únicos pasos (lo que deben teclear se encuentra después del signo $, antes de eso la Terminal sólo me indica en qué directorio estoy y cuántos comandos he pedido desde que inicié la sesión… su Terminal tal vez tiene un formato distinto antes del signo $):

  • ~ (1) $ cd desktop
  • ~/desktop (2) $ pdftk Kindle_User_Guide_English.pdf  statanews.28.3.pdf  cat output Combinado.pdf

Listo, el nuevo archivo se debe encontrar en su escritorio con el nombre de “Combinado.pdf ” (la parte de Stata News inicia en la página 121). Como ven, lo único que uno tiene que hacer es escribir 1) pdftk, 2) el nombre del archivo que aparecerá primero en el archivo final (en este caso el Kindle_User_Guide…), 3) el nombre del segundo archivo que se pegará al final del primero (en este caso el statanews.28.3.pdf se pegará al final del archivo Kindle_User_Guide…), 4) el comando de la shell de Unix cat que indica “concatenar” (en este caso concatenar el primero y segundo archivos), 5) el comando output de pdftk para indicar que lo que sigue será el archivo final (o, valga la redundancia, el “output”), 6) el nombre del archivo final.

Siguiendo con el ejemplo, supongamos que sólo queremos las páginas 3 y 4 del manual del Kindle y las páginas 8 a 10 del Stata News en un archivo llamado CombinadoAMedias.pdf. Para eso escribimos lo siguiente:

  • ~/desktop (3) $ pdftk A=Kindle_User_Guide_English.pdf  B=statanews.28.3.pdf  cat A3-4 B8-10 output CombinadoAMedias.pdf

Como verán ahora debo asignar a cada archivo una letra (A y B en este caso) para así poder solicitar las páginas que deseo. El archivo final sólo contendrá las páginas requeridas. Aquí pueden encontrar muchos más ejemplos para manipular PDFs usando pdftk. ¡Eso es todo! Ahora me regreso a perder en la tesis y seguro no volveré en un buen rato (eso sí, en esa ocasión espero escribir algún post sobre chanchullos políticos y no cosas aburridas -pero útiles- como estas).

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: