segunda-feira, 27 de outubro de 2014

Padrões de codificação de caracteres


     Caracteres são agrupados em conjuntos de caracteres (também chamados de repertório). Isso é então chamado de "conjunto de códigos de caracteres" quando a cada caractere é atribuído um número em particular, chamado decodepoint. Esses codepoints irão ser representados no computador por um ou mais bytes.

     Basicamente, isso significa que todos os caracteres são armazenados em computadores utilizando-se códigos. Uma codificação de caracteres é uma chave para o código. É um conjunto de relações entre os bytes que representam números no computador e caracteres no conjunto de caracteres codificado. Sem a chave, os dados são indecifrável.


Código ASCII


     CII é uma sigla para “American Standard Code for Information Interchange” (Código Padrão Norte-americano para Intercâmbio de Informações). Esse código foi proposto por Robert W. Bemer, visando padronizar os códigos para caracteres alfa-numéricos (letras, sinais, números e acentos). Assim seria possível que computadores de diferentes fabricantes conseguissem entender os códigos.

     O ASCII é um código numérico que representa os caracteres, usando uma escala decimal de 0 a 127. Esses números decimais são então convertidos pelo computador para binários e ele processa o comando. Sendo assim, cada uma das letras que você digitar vai corresponder a um desses códigos.

     Alguns dos caracteres não podem ser impressos (de código 0 a 31), pois eram na verdade comandos para computadores antigos.

     Para melhor entendimento aqui tem um excerto de uma tabela ASCII:

  Código Decimal    Código Binário    Código Hexadecimal    Caractere  
970110 000161a
980110 001062b
990110 001163c
1000110 010064d
1010110 010165e
1020110 011066f
1030110 011167g
1040110 100068h
910101 10115B[
920101 11005C\
930101 11015D]
940101 11105E^
950101 11115F_
1260111 11107E~



Código Unicode



     Unicode é um padrão adotado mundialmente que possibilita com que todos os caracteres de todas as linguagens escritas utilizadas no planeta possam ser representados em computadores. A “missão” do Unicode é apresentada de forma clara no web site do Unicode Consortium (entidade responsável pela sua gestão):

     Unicode fornece um número único para cada caractere, não importa a plataforma, não importa o programa e não importa a linguagem.

     O padrão Unicode é capaz de representar não somente as letras utilizadas pelas linguagens mais “familiares” para nós ocidentais, como Inglês, Espanhol, Francês e o nosso Português, mas também letras e símbolos utilizados em qualquer outra linguagem: Russo, Japonês, Chinês, Hebreu, etc. Além disso, inclui símbolos de pontuação, símbolos técnicos e outros caracteres que podem ser utilizados em texto escrito.

Mapa de Caracteres:

Mapa de Caracteres


Extras:


     Apresentamos agora algumas ferramentas de codigo ASCCI:







                       Original                                                                    Código ASCII

Sem comentários:

Enviar um comentário