Codificação de Caracteres

Páginas: 5 (1031 palavras) Publicado: 17 de setembro de 2014
Codificação de Caracteres
Introdução
A codificação de caracteres é intrínseca a computação.
Quaisquer letras, números ou ideogramas que não façam parte do alfabeto inglês, podem não ser representados de maneira correta quando não informada a codificação de caracteres utilizada, e isso compromete totalmente a leitura e compreensão das informações de um texto.
Além de prejudicar o entendimentode quem lê, a utilização incorreta da codificação pode impedir que páginas da web sejam encontradas em uma busca, bem como comprometer uma série de outro processamentos.

Definição
Os caracteres utilizados na formação de palavras, frases ou textos, são agrupados em conjuntos de caracteres (também conhecidos como charsets ou repertório de caracteres).
Algumas literaturas evidenciam adiferença entre repertório de caracteres, como sendo um conjunto completo de todos os caracteres abstratos que um sistema suporta, e conjunto de caracteres codificados como os detalhes de como representá-los usando códigos numéricos.
Para cada caractere, é atribuído um número único, denominado codepoint, cuja função é possibilitar o armazenamento, manipulação e processamento de textos pelos computadores,onde são representados por um ou mais bytes.
Faz parte do mesmo conceito de cifras, usadas para mascarar informações. Os códigos numéricos que representam os caracteres são a chave para decifrar qualquer informação. Sem a chave correta, os números perdem referencia com os caracteres, tornando os dados inutilizáveis.

Como os caracteres são representados
Os caracteres, para o usuário decomputação, podem ser representados graficamente de diferentes formas, de acordo com as definições de fonte, que determinam a aparência visual do texto.
As fontes abrangem um conjunto simples de caracteres (um conjunto bem limitado, se comparado a um charset como o Unicode, por exemplo). Elas são compostas por um conjunto de glifos, que são definições usadas para exibir caracteres.
Caso uma fonte nãotenha um glifo para representar um caractere particular, poderá ser procurado um “substituto” em outras fontes do sistema, ocasionando o surgimento de símbolos incoerentes, como no exemplo apresentado pela Figura 1.

Figura 1. Representação de caracteres não encontrados.

Problemas com a representação de caracteres
Durante os primeiros passos da computação, foram desenvolvidos repertórios,como o ASCII e o EBCDIC para suprir as necessidades da época (década de 60).
Logo surgiu a necessidade de representar sistemas de escritas diferentes (em especial, a escrita asiática necessitava de um conjunto de caracteres muito maior para ser reresentada). A partir disso, novos repertórios surgiram, como o Unicode, com mais de cem mil caracteres representados no intervalo de 0 a 10FFFFhexadecimal.

ASCII
Acrônimo para “American Standard Code for Information Interchange” é um repertório de caracteres de 7 bits para representar o alfabeto inglês. A representação dos códigos é feita em 8 bits (um byte), sendo que um deles é um bit de paridade, para detecção de erros.
São definidos ao todo 128 caracteres, sendo que 33 são de controle (não imprimíveis), utilizados no processamento detexto.
Como o ASCII prevê uma quantidade muito limitada de símbolos a serem representados, logo surgiu a necessidade de adoção de um padrão capaz de comportar letras, acentos ou ideogramas para representar alfabetos além do inglês.

Figura 2. Representação gráfica da tabela ASCII.

UNICODE
Em vez de representar apenas códigos entre 0 e 127, como o padrão ASCII, o UNICODE é capaz de utilizarcódigos de valores muito maiores.
Sua tabela contém caracteres de diversos alfabetos, permitindo a representação de acentos, para línguas latinas e símbolos utilizados por idiomas mais peculiares, como hebraico, chinês e vários outros.
No padrão Unicode, cada diferente letra ou símbolo de cada alfabeto utilizado no mundo é mapeado para um diferente code point. O codepoint é um código no formato...
Ler documento completo

Por favor, assinar para o acesso.

Estes textos também podem ser interessantes

  • codificação de caracteres
  • codificaçao
  • codificacao
  • codificaÇAO
  • Codificação
  • Codificação
  • codificação
  • Codificação

Seja um membro do Trabalhos Feitos

CADASTRE-SE AGORA!