¿Cómo detectar automáticamente la codificación de los archivos de texto?
Hay muchos archivos de texto plano que fueron codificados en conjuntos de caracteres variados.
Quiero convertirlos todos a UTF-8, pero antes de ejecutar iconv, necesito saber su codificación original. La mayoría de los navegadores tienen una opción Auto Detect
en las codificaciones, sin embargo, no puedo comprobar esos archivos de texto uno por uno porque son demasiados.
Sólo habiendo conocido la codificación original, puedo entonces convertir los textos por iconv -f DETECTED_CHARSET -t utf-8
.
¿Existe alguna utilidad para detectar la codificación de los archivos de texto plano? NO tiene que ser 100% perfecto, no me importa si hay 100 archivos mal codificados en 1.000.000 archivos.