Esto es un complemento a la respuesta de @Dennis de las 18:06 del 30 de julio de 2012. Ciertamente aborda el caso más difícil.
En el caso más sencillo en el que la marca de agua es un texto simple y sin adornos, por ejemplo
Smedley Para el Comisario
las marcas de agua en PDF sin comprimir podrían definirse así:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
donde 75.96
es el desplazamiento horizontal y 625
el desplazamiento vertical para esta instancia particular de marca de agua. (Sí, pueden verse tanto números reales como enteros).
Una regexp como la siguiente funcionará para todas esas marcas de agua, ignorando cualquier variación en su colocación:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Tenga en cuenta, sin embargo, que una variedad de operadores PDF modificadores pueden entrar en juego con las marcas de agua que tienen un formato más complicado. Este tipo de formato puede transformar lo que el lector espera (¿espera?) que sea una cadena contigua y fácil de buscar en un lío de sopa de letras. Por ejemplo,
E1 = mc² de Smedley™
Podría ser el producto de esto:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
… ¡o mucho peor si su marca de agua es de color!
Habiendo notado todo esto, también notaré que PDFtk tiene una versión GUI que pretende manejar las marcas de agua, en consideración de una cuota de licencia de $4. ¡No es nada caro!
Por otro lado, encuentro que su sitio web anuncia actualmente un soporte completo para O/S’s hasta Windows 8
y OS X 10.8 Mountain Lion
. Esa cosecha es de hace más de 4 años. ¿Puede que PDFtk se esté quedando anticuado? Sospecho que no, pero no lo sé.