¿Cómo convertir Word (doc) a PDF en linux?
Tengo un conjunto de archivos en formato .doc, que necesitan ser convertidos a formato .pdf. Estoy usando Ubuntu linux.
Tengo un conjunto de archivos en formato .doc, que necesitan ser convertidos a formato .pdf. Estoy usando Ubuntu linux.
Alternativa 1)
sudo apt-get install cups-pdf
Luego navegue a Sistema > Administración > Impresión y cree una nueva impresora, configúrela como impresora de archivos PDF, y nómbrela como “pdf”.
Luego ejecute:
oowriter -pt pdf your_word_file.doc
Ahora encontrarás tu archivo .pdf en ~/PDF.
Alternativa 2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
Si el paquete tetex-extra no está disponible con su distribución, pruebe con texlive-base más texlive-latex-base:
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
Puede utilizar:
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
Si estás ejecutando X entonces puedes hacerlo a través de Open Office. Ya que vas a oponerte a hacerlo manualmente, recuerda que hay algunos buenos scripts de macros en Open Office para que puedas automatizarlo . Puedes hacer algo parecido con AbiWord (AbiWord –to=pdf).
Si no tiene X, existe antiword, pero éste sólo extrae el texto, no hace ningún tipo de formato o gráfico. También está wvWare que he utilizado para extraer imágenes de forma masiva de archivos doc, pero nunca he intentado utilizarlo para convertir archivos doc en pdf.
Oh y los archivos .docx pueden necesitar algo diferente, pero como sólo son archivos xml comprimidos no debería ser demasiado difícil hacer algo útil con ellos. Para la extracción masiva de imágenes sólo tienes que descomprimirlas y copiar el directorio de imágenes, pero nunca he necesitado convertirlas en Linux.
Yo intentaría usar para Linux
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
Para windows
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
PyODConverter requiere que OpenOffice.org se ejecute como servicio y escuche en el puerto (por defecto) 8100; la forma más sencilla de iniciar OpenOffice.org como servicio es desde la línea de comandos:
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
Open Office es una buena manera de avanzar, pero la fidelidad de la conversión no siempre es correcta.
Si lo que buscas es una solución 100% Linux, esa es la mejor manera de avanzar. Sin embargo, si no te importa tener una sola caja de Windows y escribir un poco de código para interactuar con ella desde tu sistema Linux, entonces echa un vistazo a este post .
Yo escribí este post, así que se aplican las renuncias habituales.
dopdf
en el Windows virtual dopdf
como impresora por defecto durante la instalación.*.doc
en el Office virtual e imprimirlo en la impresora virtual dopdf
.*.pdf
aparecerá en la carpeta My Documents
del Windows virtual