2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

¿Cómo puedo determinar el tipo de archivo sin una extensión en Windows?

A veces recibo archivos de mis clientes que tienen una extensión de archivo incorrecta. Por ejemplo, el nombre es image.jpg pero el archivo es en realidad una imagen TIFF. En muchos casos puedo aclararlo abriendo el archivo en un editor de texto, mirando los primeros bytes y deduciendo entonces de qué tipo de archivo se trata.

Esto me funciona con archivos JPEG, TIFF, GIF y PDF. Sin embargo, hay muchos más tipos de archivos.

¿Es posible automatizar la identificación del tipo de archivo correcto analizando los datos que lo contienen?

Respuestas (5)

147
147
147
2011-04-24 07:47:21 +0000

Puede utilizar la herramienta TrID que cuenta con una creciente biblioteca de definiciones de tipos de archivo para identificar archivos con.

Se admiten comodines, por lo que en su ejemplo podría poner todas las imágenes a examinar en una carpeta, por ejemplo, C:\Nverifyimages - entonces puede utilizar el comando:

trid C:\verifyimages\*

Esto examinará todos los archivos en la carpeta verifyimages.

  • *

También hay una versión GUI disponible, TrIDNet :

Hay documentación disponible sobre cómo puede integrar fácilmente TrID o TrIDNet en el Explorador de Windows y en Total Commander:

Explorador de Windows

Total Commander

53
53
53
2011-04-24 07:38:08 +0000

Archivo** comprueba cada argumento para intentar clasificarlo. Hay tres conjuntos de pruebas, realizadas en este orden: pruebas del sistema de archivos, pruebas de números mágicos y pruebas de lenguaje. La primera prueba que tiene éxito hace que se imprima el tipo de archivo.

El tipo impreso normalmente contendrá una de las palabras texto (el archivo contiene sólo caracteres de impresión y unos pocos caracteres de control comunes y es probablemente seguro para leer en un terminal ASCII), ejecutable (el archivo contiene el resultado de la compilación de un programa en una forma comprensible para algún núcleo UNIX u otro), o datos que significa cualquier otra cosa (los datos son normalmente “binarios” o no imprimibles). Las excepciones son los formatos de archivo conocidos (archivos core, archivos tar) que se sabe que contienen datos binarios.

14
14
14
2011-04-24 13:16:09 +0000

Solía trabajar para la Biblioteca Nacional de Francia, para construir un sistema de archivo digital que contiene no sólo libros digitalizados, sino también millones de artefactos digitales con todo tipo de tipos de archivos extraños. Usábamos JHOVE para reconocer los formatos de archivo.

JHOVE es de código abierto, está mantenido por JSTOR y la Biblioteca de la Universidad de Harvard. Es bastante sencillo de utilizar .

1
1
1
2018-06-04 11:24:55 +0000

Puede comprobar el tipo de archivo desde cualquier ordenador, incluido Windows, en http://www.checkfiletype.com

1
1
1
2011-04-24 11:30:15 +0000

Yo uso las bibliotecas OutsideIn de Oracle en mis programas. No son gratuitas, pero funcionan bien, especialmente para las imágenes. El lenguaje de mercado dice que soporta más de 500 tipos de archivos.