Para mostrar una página HTML correctamente, un navegador web debe saber qué conjunto de caracteres usar.
De ASCII
a UTF-8
ASCII
fue el primer estándar de codificación de caracteres. ASCII
definió 128 caracteres diferentes que podrían usarse en Internet: números (0-9), letras inglesas (A-Z) y algunos caracteres especiales como !
$
+
-
( )
@
<
>
.
ISO-8859-1
era el conjunto de caracteres predeterminado para HTML 4. Este conjunto de caracteres admitía 256 códigos de caracteres diferentes. HTML 4 también admitía UTF-8
.
ANSI
(Windows-1252) era el conjunto de caracteres original de Windows. ANSI
es bastante similar a ISO-8859-1
, excepto que ANSI
tiene 32 caracteres más.
La especificación HTML5 alienta a los desarrolladores web a utilizar el conjunto de caracteres UTF-8
, que cubre casi todos los caracteres y símbolos del mundo.
El atributo charset
HTML
Para mostrar una página HTML correctamente, un navegador web debe conocer el conjunto de caracteres utilizado en la página.
Esto se especifica con la etiqueta <meta>
:
<meta charset="UTF-8">
Diferencias entre conjuntos de caracteres
La siguiente tabla muestra las diferencias entre los conjuntos de caracteres descritos anteriormente:
Número | ASCII | ANSI | 8859 | UTF-8 | Descripción |
32 | espacio | ||||
33 | ! | ! | ! | ! | signo de exclamación |
34 | " | " | " | " | comillas |
35 | # | # | # | # | símbolo de número |
36 | $ | $ | $ | $ | signo de dólar |
37 | % | % | % | % | signo de porcentaje |
38 | & | & | & | & | ampersand |
39 | ' | ' | ' | ' | apóstrofe |
40 | ( | ( | ( | ( | paréntesis izquierdo |
41 | ) | ) | ) | ) | paréntesis derecho |
42 | * | * | * | * | asterisco |
Conjunto de caracteres ASCII
ASCII
usa los valores de 0 a 31 (y 127) para los caracteres de control.
ASCII
usa los valores de 32 a 126 para letras, dígitos y símbolos.
ASCII
no utiliza los valores del 128 al 255.
Conjunto de caracteres ANSI
(Windows-1252)
ANSI
es idéntico a ASCII
para los valores de 0 a 127.
ANSI
tiene un conjunto de caracteres patentado para los valores de 128 a 159.
ANSI
es idéntico a UTF-8
para los valores de 160 a 255.
Conjunto de caracteres ISO-8859-1
ISO-8859-1
es idéntico a ASCII
para los valores de 0 a 127.
ISO-8859-1
no utiliza los valores de 128 a 159.
ISO-8859-1
es idéntico a UTF-8
para los valores de 160 a 255.
Conjunto de caracteres UTF-8
UTF-8
es idéntico a ASCII
para los valores de 0 a 127.
UTF-8
no usa los valores de 128 a 159.
UTF-8
es idéntico tanto a ANSI
como a 8859-1 para los valores de 160 a 255.
UTF-8
continúa desde el valor 256 con más de 10 000 caracteres diferentes.
Resumen
Para mostrar una página web correctamente, el navegador debe saber qué conjunto de caracteres usar. UTF-8
cubre casi todos los caracteres y símbolos del mundo.
Traducido con 💚 desde W3Schools.com