Unicode
São códigos que possibilitam a todas as linguagens serem representadas em computador. Isso inclui os símbolos usados na linguagem ocidental, por exemplo, e também os símbolos de pontuação.
Foram criados para padronizar o sistema de codificação, uma vez que seria impossível criar códigos para cada letra, símbolo e sinal de pontuação para cada linguagem existente. Além de garantir que nenhuma letra ou símbolo será representado pelo mesmo código ou vice versa.
O padrão Unicode é mantido por uma organização sem fins lucrativos chamada Unicode Consortium.
Como o Unicode funciona?
Cada letra ou símbolo de cada linguagem é representado por um código exclusivo, independente da plataforma, programa ou língua. São os code points, formados pela letra U+aaaa, em que U+ se refere a valores de código Unicode e aaaa representa um número de quatro dígitos hexadecimais de um caractere codificado, sendo diferenciados também entre letras maiúsculas e minúsculas.
Exemplo:
B = U+0042 A = U+0041 a = U+0061
Os caracteres são representados utilizando-se glifos, que nada mais é do que as diferentes formas, fontes e tamanhos para exibir os caracteres.
O padrão Unicode garante uma redução de custo às empresas, pois possibilita que os programas desenvolvidos com esse esquema mantenham sua exatidão devido ao fato de os caracteres terem uma única definição, possibilitando a mesma interpretação independente da arquitetura do computador. Além disso, um software, por exemplo, pode ser executado em diferentes computadores ou sistemas operacionais.
Por outro lado, o Unicode requer uma maior quantidade de memória. Enquanto os conjuntos de caracteres ASCII têm comprimento de 8 bits, o Padrão Unicode possui 16 bits. E embora inclua mais caracteres do que qualquer outro conjunto de caracteres, ele ainda não codifica todos os caracteres escritos mundiais.