Caracteres são agrupados em conjuntos de caracteres (também chamados de repertório). Isso é então chamado de "conjunto de códigos de caracteres" quando a cada caractere é atribuído um número em particular, chamado decodepoint. Esses codepoints irão ser representados no computador por um ou mais bytes.
Basicamente, isso significa que todos os caracteres são armazenados em computadores utilizando-se códigos. Uma codificação de caracteres é uma chave para o código. É um conjunto de relações entre os bytes que representam números no computador e caracteres no conjunto de caracteres codificado. Sem a chave, os dados são indecifrável.
Código ASCII
O ASCII é um código numérico que representa os caracteres, usando uma escala decimal de 0 a 127. Esses números decimais são então convertidos pelo computador para binários e ele processa o comando. Sendo assim, cada uma das letras que você digitar vai corresponder a um desses códigos.
Alguns dos caracteres não podem ser impressos (de código 0 a 31), pois eram na verdade comandos para computadores antigos.
Para melhor entendimento aqui tem um excerto de uma tabela ASCII:
Código Decimal | Código Binário | Código Hexadecimal | Caractere |
97 | 0110 0001 | 61 | a |
98 | 0110 0010 | 62 | b |
99 | 0110 0011 | 63 | c |
100 | 0110 0100 | 64 | d |
101 | 0110 0101 | 65 | e |
102 | 0110 0110 | 66 | f |
103 | 0110 0111 | 67 | g |
104 | 0110 1000 | 68 | h |
91 | 0101 1011 | 5B | [ |
92 | 0101 1100 | 5C | \ |
93 | 0101 1101 | 5D | ] |
94 | 0101 1110 | 5E | ^ |
95 | 0101 1111 | 5F | _ |
126 | 0111 1110 | 7E | ~ |
Código Unicode
Unicode é um padrão adotado mundialmente que possibilita com que todos os caracteres de todas as linguagens escritas utilizadas no planeta possam ser representados em computadores. A “missão” do Unicode é apresentada de forma clara no web site do Unicode Consortium (entidade responsável pela sua gestão):
Unicode fornece um número único para cada caractere, não importa a plataforma, não importa o programa e não importa a linguagem.
O padrão Unicode é capaz de representar não somente as letras utilizadas pelas linguagens mais “familiares” para nós ocidentais, como Inglês, Espanhol, Francês e o nosso Português, mas também letras e símbolos utilizados em qualquer outra linguagem: Russo, Japonês, Chinês, Hebreu, etc. Além disso, inclui símbolos de pontuação, símbolos técnicos e outros caracteres que podem ser utilizados em texto escrito.
Mapa de Caracteres:
Extras:
Apresentamos agora algumas ferramentas de codigo ASCCI:
Original Código ASCII