orm@doc-tcpip.org

Erstellt: Februar 2001 - Letzte Modifikation: Juni 2001

[ Main | Local ]


ASCII Tabelle


Zeichensätze

Heute wird ein Zeichen in der Regel als ein 8-Bit Zahlenwert dargestellt. Die Aufgabe des Zeichensatzes ist es, diese Werte mit dem Bild zu korrelieren, den ein Bildschirm oder Drucker dann ausgibt. Es gibt sehr viele solche Zeichensätze, und unter Unix ist es meist möglich, selbst einen zu definieren. Diese basieren dann auf ASCII (American Standard Code for Information Interchange). Wenn man irgendwo einen IBM Großrechner hat, dann findet sich wahrscheinlich auch noch EBCDIC (Extended Binary Coded Decimal Information Code).

Mit einem Byte pro Zeichen kann man 256 Zeichen darstellen. ASCII ist eigentlich 7 bittig, sodaß nur die ersten 128 Zeichen benutzt werden. Die ersten 32 sind Steuerzeichen und nicht darstellbar. Die anderen Zeichen (bis 127) sind die Buchstaben und Sonderzeichen, die man in Amerika braucht. Der Rest steht zur "freien" Verfügung. Damit das nicht ins Kraut schießt, wurde der ANSI (American National Standards Institute) Standard ersonnen (die ganzen iso-xxxx Zeichensätze). Das geht folgendermaßen: Die ersten 128 Zeichen des ASCII-Standards werden übernommen, und dann wird regional Brauchbares hinzudefiniert.

Die Zukunft des Ganzen ist UCS (Universal Character Set). Das baut auf ASCII auf (ISO 10646). Laut RFC 2277 sollen alle neuen Internet Protokolle diesen Standard implementieren. Es wird dabei die 8-Bit Grenze durchbrochen, jedes Zeichen jeder Sprache soll dann mit einem 16-Bit Feld und eine 20-Bit Erweiterung darstellbar sein. Für die ASCII-Kompatibilität sorgt UTF-8 und eine Reihe weiterer Programme. Ein sehr guter Link ist hier czyborra.com

Die ASCII Tabelle

Eine kurze Erklärung:
Die Tabelle zeigt an den Rändern den Hex-Wert des Zeichens.
Dabei geht es von links nach rechts, also Zeile 5 und Spalte 2 ist hex 52, damit ASCII "R".

.   0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
0  NUL SOH STX ETX EOT ENQ ACK BEL BS  HT  LF  VT  FF  CR  SO  SI
1  DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM  SUB ESC FS  GS  RS  US
2   SP  !   "   #   $   %   &   '   (   )   *   +   ,   -   .   /
3   0   1   2   3   4   5   6   7   8   9   :   ;   <   =   >   ?
4   @   A   B   C   D   E   F   G   H   I   J   K   L   M   N   O
5   P   Q   R   S   T   U   V   W   X   Y   Z   [       ]   ^   _
6   `   a   b   c   d   e   f   g   h   i   j   k   l   m   n   o
7   p   q   r   s   t   u   v   w   x   y   z   {   |   }   ~  DEL


Hier eine genauere Beschreibung der ersten 32 ASCII Zeichen, die sogenannten "Control Codes".

NUL (null)
SOH (start of heading)
STX (start of text)
ETX (end of text)
EOT (end of transmission) - Ungleich ETB!
ENQ (enquiry)
ACK (acknowledge)
BEL (bell) - Auf Teletypes klingelt es. Mit den meisten Terminals und Teminal-Emulationen piept es.
BS (backspace) - Cursor oder Druckkopf bewegt sich nach links um eine Stelle
TAB (horizontal tab) - Cursor oder Druckkopf bewegt sich nach rechts zum nächsten Tabulator. Meist 8 oder 10 Zeichen, das kommt aber auf das Gerät an. LF (NL line feed, new line) - Cursor oder Druckkopf springt in eine neue Zeile. Auf Unix Systemen wird in eine neue Zeile gesprungen und der Cursor/Druckkopf wird ganz links positioniert.
VT (vertical tab)
FF (form feed) - Drucker: Vorrücken auf die nächste Seite.
CR (carriage return) - Cursor/Druckkopf ganz nach links, aber *nicht* in die nächste Zeile springen.
SO (shift out) - Umschalten der Ausgabeeinheit auf ein anderes Charakter-Set.
SI (shift in) - Zurückschalten der Ausgabeeinheit auf das Default Charakter-Set.
DLE (data link escape)
DC1 (device control 1)
DC2 (device control 2)
DC3 (device control 3)
DC4 (device control 4)
NAK (negative acknowledge)
SYN (synchronous idle)
ETB (end of transmission block) - Das ist *nicht* EOT
CAN (cancel)
EM (end of medium)
SUB (substitute)
ESC (escape)
FS (file separator)
GS (group separator)
RS (record separator)
US (unit separator)


[ Main | Local ]

[ Allgemein | UNIX | AIX | TCP-IP | TCP | ROUTING | DNS | NTP | NFS | FreeBSD | Linux | RPi | SMTP | Tracing | GPS | LW ]

Copyright 2001-2021 by Orm Hager - Es gilt die GPL
Feedback bitte an: Orm Hager (orm@doc-tcpip.org )