domingo, 23 de octubre de 2011
CODIGOS
ASCII (acrónimo inglés de American Standard Code for Information Interchange — Código Estándar Americano para el Intercambio de Información), pronunciado generalmente [áski] o [ásci] , es un código de caracteres basado en el alfabeto latino, tal como se usa en inglés moderno y en otras lenguas occidentales. Fue creado en 1963 por el Comité Estadounidense de Estándares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estándares Nacionales, o ANSI) como una refundición o evolución de los conjuntos de códigos utilizados entonces en telegrafía. Más tarde, en 1967, se incluyeron las minúsculas, y se redefinieron algunos códigos de control para formar el código conocido como US-ASCII.
El código ASCII utiliza 7 bits para representar los caracteres, aunque inicialmente empleaba un bit adicional (bit de paridad) que se usaba para detectar errores en la transmisión. A menudo se llama incorrectamente ASCII a otros códigos de caracteres de 8 bits, como el estándar ISO-8859-1 que es una extensión que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al inglés, como el español.
ASCII fue publicado como estándar por primera vez en 1967 y fue actualizado por última vez en 1986. En la actualidad define códigos para 33 caracteres no imprimibles, de los cuales la mayoría son caracteres de control obsoletos que tienen efecto sobre cómo se procesa el texto, más otros 95 caracteres imprimibles que les siguen en la numeración (empezando por el carácter espacio).
Casi todos los sistemas informáticos actuales utilizan el código ASCII o una extensión compatible para representar textos y para el control de dispositivos que manejan texto como el teclado. No deben confundirse los códigos ALT+número de teclado con los códigos ASCII.
Las computadoras solamente entienden números. El código ASCII es una representación numérica de un carácter como ‘a’ o ‘@’.1
Como otros códigos de formato de representación de caracteres, el ASCII es un método para una correspondencia entre cadenas de bits y una serie de símbolos (alfanuméricos y otros), permitiendo de esta forma la comunicación entre dispositivos digitales así como su procesado y almacenamiento. El código de caracteres ASCII2 —o una extensión compatible (ver más abajo)— se usa casi en todos los ordenadores, especialmente con ordenadores personales y estaciones de trabajo. El nombre más apropiado para este código de caracteres es "US-ASCII".3
|
ASCII es, en sentido estricto, un código de siete bits, lo que significa que usa cadenas de bits representables con siete dígitos binarios (que van de 0 a 127 en base decimal) para representar información de caracteres. En el momento en el que se introdujo el código ASCII muchos ordenadores trabajaban con grupos de ocho bits (bytes u octetos), como la unidad mínima de información; donde el octavo bit se usaba habitualmente como bit de paridad con funciones de control de errores en líneas de comunicación u otras funciones específicas del dispositivo. Las máquinas que no usaban la comprobación de paridad asignaban al octavo bit el valor cero en la mayoría de los casos, aunque otros sistemas como las computadoras Prime, que ejecutaban PRIMOS ponían el octavo bit del código ASCII a uno.
El código ASCII define una relación entre caracteres específicos y secuencias de bits; además de reservar unos cuantos códigos de control para el procesador de textos, y no define ningún mecanismo para describir la estructura o la apariencia del texto en un documento; estos asuntos están especificados por otros lenguajes
El código ASCII se desarrolló en el ámbito de la telegrafía y se usó por primera vez comercialmente como un código de teleimpresión impulsado por los servicios de datos de Bell. Bell había planeado usar un código de seis bits, derivado de Fieldata, que añadía puntuación y letras minúsculas al más antiguo código de teleimpresión Baudot, pero se les convenció para que se unieran al subcomité de la Agencia de Estándares Estadounidense (ASA), que habían empezado a desarrollar el código ASCII. Baudot ayudó en la automatización del envío y recepción de mensajes telegráficos, y tomó muchas características del código Morse; sin embargo, a diferencia del código Morse, Baudot usó códigos de longitud constante. Comparado con los primeros códigos telegráficos, el código propuesto por Bell y ASA resultó en una reorganización más conveniente para ordenar listas (especialmente porque estaba ordenado alfabéticamente) y añadió características como la 'secuencia de escape'.
La Agencia de Estándares Estadounidense (ASA), que se convertiría más tarde en el Instituto Nacional Estadounidense de Estándares (ANSI), publicó por primera vez el código ASCII en 1963. El ASCII publicado en 1963 tenía una flecha apuntando hacia arriba (↑) en lugar del circunflejo (^) y una flecha apuntando hacia la izquierda en lugar del guion bajo (_). La versión de 1967 añadió las letras minúsculas, cambió los nombres de algunos códigos de control y cambió de lugar los dos códigos de control ACK y ESC de la zona de letras minúsculas a la zona de códigos de control.
ASCII fue actualizado en consecuencia y publicado como ANSI X3.4-1968, ANSI X3.4-1977, y finalmente ANSI X3.4-1986.
Otros órganos de estandarización han publicado códigos de caracteres que son idénticos a ASCII. Estos códigos de caracteres reciben a menudo el nombre de ASCII, a pesar de que ASCII se define estrictamente solamente por los estándares ASA/ANSI:
- La Asociación Europea de Fabricantes de Ordenadores (ECMA) publicó ediciones de su clon de ASCII, ECMA-6 en 1965, 1967, 1970, 1973, 1983, y 1991. La edición de 1991 es idéntica a ANSI X3.4-1986.4
- La Organización Internacional de Estandarización (ISO) publicó su versión, ISO 646 (más tarde ISO/IEC 646) en 1967, 1972, 1983 y 1991. En particular, ISO 646:1972 estableció un conjunto de versiones específicas para cada país donde los caracteres de puntuación fueron reemplazados con caracteres no ingleses. ISO/IEC 646:1991 La International Reference Version es la misma que en el ANSI X3.4-1986.
- La Unión Internacional de Telecomunicaciones (ITU) publicó su versión de ANSI X3.4-1986, Recomendación ITU T.50, en 1992. A principios de la década de 1970 publicó una versión como Recomendación CCITT V.3.
- DIN publicó una versión de ASCII como el estándar DIN 66003 en 1974.
- El Grupo de Trabajo en Ingeniería de Internet (IETF) publicó una versión en 1969 como RFC 20, y estableció la versión estándar para Internet, basada en ANSI X3.4-1986, con la publicación deRFC 1345 en 1992.
- La versión de IBM de ANSI X3.4-1986 se publicó en la literatura técnica de IBM como página de códigos 367.
El código ASCII también está incluido en su probable relevo, Unicode, constituyendo los primeros 128 caracteres (o los 'más bajos').
[editar]
Binario | Decimal | Hex | Abreviatura | Repr | AT | Nombre/Significado |
---|---|---|---|---|---|---|
0000 0000 | 0 | 00 | NUL | ␀ | ^@ | Carácter Nulo |
0000 0001 | 1 | 01 | SOH | ␁ | ^A | Inicio de Encabezado |
0000 0010 | 2 | 02 | STX | ␂ | ^B | Inicio de Texto |
0000 0011 | 3 | 03 | ETX | ␃ | ^C | Fin de Texto |
0000 0100 | 4 | 04 | EOT | ␄ | ^D | Fin de Transmisión |
0000 0101 | 5 | 05 | ENQ | ␅ | ^E | Consulta |
0000 0110 | 6 | 06 | ACK | ␆ | ^F | Acuse de recibo |
0000 0111 | 7 | 07 | BEL | ␇ | ^G | Timbre |
0000 1000 | 8 | 08 | BS | ␈ | ^H | Retroceso |
0000 1001 | 9 | 09 | HT | ␉ | ^I | Tabulación horizontal |
0000 1010 | 10 | 0A | LF | ␊ | ^J | Salto de línea |
0000 1011 | 11 | 0B | VT | ␋ | ^K | Tabulación Vertical |
0000 1100 | 12 | 0C | FF | ␌ | ^L | De avance |
0000 1101 | 13 | 0D | CR | ␍ | ^M | Retorno de carro |
0000 1110 | 14 | 0E | SO | ␎ | ^N | Mayúsculas fuera |
0000 1111 | 15 | 0F | SI | ␏ | ^O | En mayúsculas |
0001 0000 | 16 | 10 | DLE | ␐ | ^P | Enlace de datos / Escape |
0001 0001 | 17 | 11 | DC1 | ␑ | ^Q | Dispositivo de control 1 — oft. XON |
0001 0010 | 18 | 12 | DC2 | ␒ | ^R | Dispositivo de control 2 |
0001 0011 | 19 | 13 | DC3 | ␓ | ^S | Dispositivo de control 3 — oft. XOFF |
0001 0100 | 20 | 14 | DC4 | ␔ | ^T | Dispositivo de control 4 |
0001 0101 | 21 | 15 | NAK | ␕ | ^U | Confirmación negativa |
0001 0110 | 22 | 16 | SYN | ␖ | ^V | Síncrono en espera |
0001 0111 | 23 | 17 | ETB | ␗ | ^W | Fin de Transmision del Bloque |
0001 1000 | 24 | 18 | CAN | ␘ | ^X | Cancelar |
0001 1001 | 25 | 19 | EM | ␙ | ^Y | Finalización del Medio |
0001 1010 | 26 | 1A | SUB | ␚ | ^Z | Substituto |
0001 1011 | 27 | 1B | ESC | ␛ | ^[ or ESC | Escape |
0001 1100 | 28 | 1C | FS | ␜ | ^\ | Separador de fichero |
0001 1101 | 29 | 1D | GS | ␝ | ^] | Separador de grupo |
0001 1110 | 30 | 1E | RS | ␞ | ^^ | Separador de registro |
0001 1111 | 31 | 1F | US | ␟ | ^_ | Separador de unidad |
0111 1111 | 127 | 7F | DEL | ␡ | ^?, Delete o Backspace | Eliminar |
EBCDIC (Extended Binary Coded Decimal Interchange Code) es un código estándar de 8 bits usado por computadoras mainframe IBM. IBM adaptó el EBCDIC del código de tarjetas perforadas en los años 1960 y lo promulgó como una táctica customer-control cambiando el código estándar ASCII.
EBCDIC es un código binario que representa caracteres alfanuméricos, controles y signos de puntuación. Cada carácter está compuesto por 8 bits = 1 byte, por eso EBCDIC define un total de 256 caracteres.
Existen muchas versiones ("codepages") de EBCDIC con caracteres diferentes, respectivamente sucesiones diferentes de los mismos caracteres. Por ejemplo al menos hay 9 versiones nacionales de EBCDIC con Latín 1 caracteres con sucesiones diferentes.
El siguiente es el código CCSID 500, una variante de EBCDIC. Los caracteres 0x00–0x3F y 0xFF son de control, 0x40 es un espacio, 0x41 es no-saltar página y 0xCA es un guion suave.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | ||
40 | â | ä | à | á | ã | å | ç | ñ | [ | . | < | ( | + | ! | |||
50 | & | é | ê | ë | è | í | î | ï | ì | ß | ] | $ | * | ) | ; | ^ | |
60 | - | / | Â | Ä | À | Á | Ã | Å | Ç | Ñ | ¦ | , | % | _ | > | ? | |
70 | ø | É | Ê | Ë | È | Í | Î | Ï | Ì | ` | : | # | @ | ' | = | " | |
80 | Ø | a | b | c | d | e | f | g | h | i | « | » | ð | ý | þ | ± | |
90 | ° | j | k | l | m | n | o | p | q | r | ª | º | æ | ¸ | Æ | ¤ | |
A0 | µ | ~ | s | t | u | v | w | x | y | z | ¡ | ¿ | Ð | Ý | Þ | ® | |
B0 | ¢ | £ | ¥ | · | © | § | ¶ | ¼ | ½ | ¾ | ¬ | | | ¯ | ¨ | ´ | × | |
C0 | { | A | B | C | D | E | F | G | H | I | ô | ö | ò | ó | õ | ||
D0 | } | J | K | L | M | N | O | P | Q | R | ¹ | û | ü | ù | ú | ÿ | |
E0 | \ | ÷ | S | T | U | V | W | X | Y | Z | ² | Ô | Ö | Ò | Ó | Õ | |
F0 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ³ | Û | Ü | Ù | Ú |
Espacio en blanco - 0 1 0 0 0 0 0 0
Letras mayúsculas de la A a la Z: se dividen en tres grupos (A-I), (J-R), (S-Z) y en las primeras cuatro posiciones se identifica el grupo al cual pertenece la letra y en las restantes cuatro posiciones el dígito correspondiente a la posición de la letra en el grupo.
A - 1 1 0 0 0 0 0 1
B - 1 1 0 0 0 0 1 0
C - 1 1 0 0 0 0 1 1
D - 1 1 0 0 0 1 0 0
E - 1 1 0 0 0 1 0 1
F - 1 1 0 0 0 1 1 0
G - 1 1 0 0 0 1 1 1
H - 1 1 0 0 1 0 0 0
I - 1 1 0 0 1 0 0 1
J - 1 1 0 1 0 0 0 1
K - 1 1 0 1 0 0 1 0
L - 1 1 0 1 0 0 1 1
M - 1 1 0 1 0 1 0 0
N - 1 1 0 1 0 1 0 1
O - 1 1 0 1 0 1 1 0
P - 1 1 0 1 0 1 1 1
Q - 1 1 0 1 1 0 0 0
R - 1 1 0 1 1 0 0 1
S - 1 1 1 0 0 0 1 0
T - 1 1 1 0 0 0 1 1
U - 1 1 1 0 0 1 0 0
V - 1 1 1 0 0 1 0 1
W - 1 1 1 0 0 1 1 0
X - 1 1 1 0 0 1 1 1
Y - 1 1 1 0 1 0 0 0
Z - 1 1 1 0 1 0 0 1
La letra Ñ se representa 0 1 1 0 1 0 0 1
Los dígitos del cero (0) al nueve (9): se identifican con un uno en las primeras cuatro posiciones y en las restantes cuatro posiciones el dígito en binario.
0 - 1 1 1 1 0 0 0 0
1 - 1 1 1 1 0 0 0 1
2 - 1 1 1 1 0 0 1 0
3 - 1 1 1 1 0 0 1 1
4 - 1 1 1 1 0 1 0 0
5 - 1 1 1 1 0 1 0 1
6 - 1 1 1 1 0 1 1 0
7 - 1 1 1 1 0 1 1 1
8 - 1 1 1 1 1 0 0 0
9 - 1 1 1 1 1 0 0 1
|