2012-07-30 18:01:56 +0000 2012-07-30 18:01:56 +0000
42
42
Advertisement

¿Cómo eliminar una marca de agua de un archivo PDF?

Advertisement

Pensé que sería una tarea sencilla, pero resultó lo contrario.

La marca de agua es la misma imagen (superpuesta, pero transparente) en todas las páginas. He creado el archivo PDF yo mismo (así que no hay que preocuparse por los derechos de autor) usando PDFCreator 0.9.8.

Ya he probado el Adobe Acrobat Pro de mi amigo, pero no ha funcionado. Intenta eliminarlo, pero no puede. He intentado quitar el encabezado/pie de página, etc., pero la marca de agua no desaparece.

¿Cómo puedo eliminar la marca de agua?

Advertisement
Advertisement

Respuestas (7)

74
74
74
2012-07-30 18:06:32 +0000

Para las marcas de agua basadas en imágenes, existen varias herramientas que prometen su eliminación automática. Por ejemplo:

Todas ellas son gratuitas para probar, pero requieren una licencia para producir realmente el resultado deseado.

Sin embargo, la marca de agua de este archivo PDF específico (que el OP me envió por correo electrónico) no es una sola imagen que se repite en todas las páginas. Resulta que PDFCreator la ha codificado (casi píxel a píxel) en cada una de ellas. Esto hace que la marca de agua sea mucho más difícil de eliminar (y resulta en un archivo PDF bastante hinchado).

Dado que la marca de agua está compuesta por muchas imágenes diminutas, puede eliminarlas con un editor de PDF (por ejemplo, Foxit Advanced PDF Editor ), simplemente seleccionándolas y pulsando Eliminar. Desgraciadamente, hay que repetirlo para cada página.

Una solución menos lenta sería eliminar la marca de agua mediante programación. Para ello necesitamos

Pasos

  1. Descargue Pdftk y extraiga pdftk.exe y libiconv2.dll a %windir%\System32 , un directorio en la ruta o cualquier otra ubicación de su elección.

  2. Descargue e instale Notepad++.

  3. Las secuencias de PDF suelen comprimirse utilizando el algoritmo DEFLATE . Esto ahorra espacio, pero hace que la fuente del PDF sea ilegible.

  4. Abra uncompressed.pdf con Notepad++ para revelar la estructura de la marca de agua.

  5. Presione Ctrl + H y ponga lo siguiente:

  6. La marca de agua ha sido eliminada, pero el archivo PDF tiene errores (las longitudes de las secuencias son incorrectas) y está sin comprimir.

  7. uncompressed.pdf ya no es necesario. Puede eliminarlo.

El resultado es el mismo PDF sin la marca de agua (y con la mitad de tamaño).

6
6
6
2012-07-30 18:05:35 +0000

Parece que la marca de agua forma parte de las imágenes del archivo .PDF y no es una imagen separada que se ha creado con lo que se está utilizando para mostrar el archivo .PDF. Es posible que no pueda eliminar la marca de agua sin extraer las imágenes del .PDF, pasarlas por un editor de imágenes y luego reconstruir el .PDF manualmente.

4
Advertisement
4
4
2014-12-16 18:45:16 +0000
Advertisement

Para las marcas de agua de texto, editar una versión PostScript puede ser mucho más fácil: Después de

$ pdftops documento.pdf

editar documento.ps, luego convertir de nuevo a PDF mediante

$ ps2pdf documento.ps

1
1
1
2014-10-23 19:26:41 +0000

Los artefactos del sello son que puedes borrarlo dentro de Adobe Acrobat Pro, sin embargo se regenera al mover el ratón porque el objeto stream lo mantiene persistente.

Si intentas editar la fuente del pdf - lo cual es complicado, existe la posibilidad de que el archivo se corrompa.

Si el sello es un stream, podemos interrumpirlo desconectando el ordenador de la Red, cosa que hice.

Luego, usando el Adobe Acrobat Pro, seleccioné una de mis anotaciones, hice clic con el botón derecho del ratón para obtener la ventana emergente y seleccioné “Mostrar lista de comentarios”.

Seleccione la nefasta marca de agua/sello de la lista, haga clic con el botón derecho para obtener la ventana emergente y seleccione “Eliminar”. Haga esto en cada página donde se produzca la fijación.

Guarde el archivo con otro nombre. Mi aplicación se bloqueó, ¡pero no antes de guardar el archivo!

Abrir el nuevo archivo, mucho más pequeño; notar que todas las marcas de agua/sellos son gonzo.

En mi caso, el tamaño del archivo de mi documento de 3 páginas se redujo de 300 kb a unos impresionantes 60 kb. Todos los datos y anotaciones originales permanecieron intactos, sin las marcas de agua.

~Buena caza :o)

1
Advertisement
1
1
2017-03-17 12:49:33 +0000
Advertisement

He encontrado otra forma de hacerlo:

  1. Utilice la herramienta pdf2htmlEX (o cualquier otro convertidor de PDF a HTML) para convertir el PDF en un archivo HTML.
  2. Edite el HTML con un editor de texto y elimine la marca de agua. Guárdelo.
  3. Imprima el HTML en un nuevo documento PDF
  4. Beneficio
1
1
1
2015-01-13 15:42:01 +0000

convertir el documento en un archivo .rtf utilizando zamzar. La marca de agua desaparece automáticamente después de la conversión. Nota: - Funciona perfectamente si el documento contiene material de texto. Siempre ha sido de gran ayuda.. (Usuario de Mac)

0
Advertisement
0
0
2016-10-16 05:22:05 +0000
Advertisement

Esto es un complemento a la respuesta de @Dennis de las 18:06 del 30 de julio de 2012. Ciertamente aborda el caso más difícil.

En el caso más sencillo en el que la marca de agua es un texto simple y sin adornos, por ejemplo

Smedley Para el Comisario

las marcas de agua en PDF sin comprimir podrían definirse así:

BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

donde 75.96 es el desplazamiento horizontal y 625 el desplazamiento vertical para esta instancia particular de marca de agua. (Sí, pueden verse tanto números reales como enteros).

Una regexp como la siguiente funcionará para todas esas marcas de agua, ignorando cualquier variación en su colocación:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Tenga en cuenta, sin embargo, que una variedad de operadores PDF modificadores pueden entrar en juego con las marcas de agua que tienen un formato más complicado. Este tipo de formato puede transformar lo que el lector espera (¿espera?) que sea una cadena contigua y fácil de buscar en un lío de sopa de letras. Por ejemplo,

E1 = mc² de Smedley™

Podría ser el producto de esto:

BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

… ¡o mucho peor si su marca de agua es de color!

Habiendo notado todo esto, también notaré que PDFtk tiene una versión GUI que pretende manejar las marcas de agua, en consideración de una cuota de licencia de $4. ¡No es nada caro!

Por otro lado, encuentro que su sitio web anuncia actualmente un soporte completo para O/S’s hasta Windows 8 y OS X 10.8 Mountain Lion. Esa cosecha es de hace más de 4 años. ¿Puede que PDFtk se esté quedando anticuado? Sospecho que no, pero no lo sé.

Advertisement

Preguntas relacionadas

3
19
10
28
5
Advertisement
Advertisement