HTML Charset

HTML Charset

La ruta del desarrollador web frontend autónomo🤹‍♂️


Para mostrar una página HTML correctamente, un navegador web debe saber qué conjunto de caracteres usar.


De ASCII a UTF-8

ASCII fue el primer estándar de codificación de caracteres. ASCII definió 128 caracteres diferentes que podrían usarse en Internet: números (0-9), letras inglesas (A-Z) y algunos caracteres especiales como ! $ + - ( ) @ < > .

ISO-8859-1 era el conjunto de caracteres predeterminado para HTML 4. Este conjunto de caracteres admitía 256 códigos de caracteres diferentes. HTML 4 también admitía UTF-8.

ANSI (Windows-1252) era el conjunto de caracteres original de Windows. ANSI es bastante similar a ISO-8859-1, excepto que ANSI tiene 32 caracteres más.

La especificación HTML5 alienta a los desarrolladores web a utilizar el conjunto de caracteres UTF-8, que cubre casi todos los caracteres y símbolos del mundo.


El atributo charset HTML

Para mostrar una página HTML correctamente, un navegador web debe conocer el conjunto de caracteres utilizado en la página.

Esto se especifica con la etiqueta <meta>:

<meta charset="UTF-8">

Diferencias entre conjuntos de caracteres

La siguiente tabla muestra las diferencias entre los conjuntos de caracteres descritos anteriormente:

NúmeroASCIIANSI8859UTF-8Descripción
32espacio
33!!!!signo de exclamación
34""""comillas
35####símbolo de número
36$$$$signo de dólar
37%%%%signo de porcentaje
38&&&&ampersand
39''''apóstrofe
40((((paréntesis izquierdo
41))))paréntesis derecho
42****asterisco

Conjunto de caracteres ASCII

ASCII usa los valores de 0 a 31 (y 127) para los caracteres de control.

ASCII usa los valores de 32 a 126 para letras, dígitos y símbolos.

ASCII no utiliza los valores del 128 al 255.


Conjunto de caracteres ANSI (Windows-1252)

ANSI es idéntico a ASCII para los valores de 0 a 127.

ANSI tiene un conjunto de caracteres patentado para los valores de 128 a 159.

ANSI es idéntico a UTF-8 para los valores de 160 a 255.


Conjunto de caracteres ISO-8859-1

ISO-8859-1 es idéntico a ASCII para los valores de 0 a 127.

ISO-8859-1 no utiliza los valores de 128 a 159.

ISO-8859-1 es idéntico a UTF-8 para los valores de 160 a 255.


Conjunto de caracteres UTF-8

UTF-8 es idéntico a ASCII para los valores de 0 a 127.

UTF-8 no usa los valores de 128 a 159.

UTF-8 es idéntico tanto a ANSI como a 8859-1 para los valores de 160 a 255.

UTF-8 continúa desde el valor 256 con más de 10 000 caracteres diferentes.


Resumen

Para mostrar una página web correctamente, el navegador debe saber qué conjunto de caracteres usar. UTF-8 cubre casi todos los caracteres y símbolos del mundo.


Traducido con 💚 desde W3Schools.com

Did you find this article valuable?

Support Santos Romero by becoming a sponsor. Any amount is appreciated!