2009-08-11 13:11:38 +0000 2009-08-11 13:11:38 +0000
26
26

¿Cómo puedo editar texto Unicode en Notepad++?

A veces edito texto en inglés que incluye caracteres Unicode. Por alguna razón, en mi PC, el Bloc de notas++ convierte caracteres Unicode a ???‘s corrompiendo así el texto y perdiendo todos esos datos. Estoy buscando una forma de editar dicho texto, conservando los caracteres Unicode. Estoy usando Consolas como fuente. Si la fuente no tiene todos esos caracteres, ¿por qué debería perder los datos cuando copio el texto fuera del Notepad++ (a través del portapapeles de Windows)?

Respuestas (5)

15
15
15
2011-09-17 11:54:32 +0000

El problema descrito en la pregunta ocurre cuando un documento vacío/nuevo está configurado como “ANSI”, y se pegan en él caracteres Unicode .

No hay ninguna autodetección cuando se usa con un documento vacío/nuevo, al menos no en la versión de Notepad++ en la que lo he probado (v5.4.5). “ANSI” es el predeterminado en Notepad++ para un nuevo documento, a menos que se configure en el menú ConfiguraciónPreferencias → pestaña Nuevo documento/Abrir directorio de guardado.

Solución

La solución es establecer la codificación a UTF-8 antes de pegar, menú FormatoCodificar en UTF-8:

Ejemplo

He copiado un texto en un nuevo documento de Notepad++, Ruso (русский язык, russkiy yazyk), desde Firefox mostrando la página de Wikipedia idioma ruso _.

Si la codificación no se cambia de “ANSI” este es el resultado:

Si la codificación se cambia este es el resultado:

Como se puede ver en la figura de abajo (la parte de cirílico está resaltada), el Bloc de notas++ realmente convierte los caracteres Unicode en ASCII 63 (hexadecimal 3F), signos de interrogación. Por eso los caracteres Unicode se pierden (en modo “ANSI”) al copiar el texto a través del portapapeles (no es _un problema de fuente - la información se pierde).

Probado en: Notepad++ v5.4.5 (UNICODE).

15
15
15
2009-08-11 13:30:37 +0000

Si el archivo está realmente codificado en Unicode, Notepad++ debería detectarlo automáticamente. La fuente Consolas me funciona bien. Puedes probar una de estas dos opciones del menú:

  • Codificación -> Codificar en UTF-8
  • Codificación -> Convertir a UTF-8

Estoy bastante seguro de que la primera hará lo que quieres.

5
5
5
2009-08-11 13:30:46 +0000

Hay buenas y malas noticias.

Buenas noticias: Notepad++ soporta Unicode (al menos por lo que he podido averiguar).

Malas noticias: Aparentemente el soporte de Unicode es sólo en Windows XP.

La verdad es que no tengo una máquina con Windows delante. Por lo que recuerdo, hay un menú de Codificación bajo el menú de Formato en alguna parte. La codificación para Unicode es en realidad más comúnmente UTF-8.

Aquí hay una imagen ‘bonita’ del soporte de Unicode en Notepad++,

1
1
1
2015-04-14 13:13:05 +0000

Esto me ha funcionado:

He cambiado la fuente a Courier New en el configurador de estilo de mi PC (Windows 7 con conjunto de caracteres inglés/estadounidense y rumano para el conjunto no Unicode). Funciona con las fuentes Courier New y Tahoma + codificación UTF-8.

0
0
0
2018-09-19 10:12:31 +0000

En el menú superior seleccione el Encoding luego elija Encode in UTF-8 o Encode in UTF-8 Without BOM entonces podrá editar el texto en codificación Unicode.