ISO 8859-2
-1 | Latin-1, Westeuropäisch |
---|---|
-2 | Latin-2, Mitteleuropäisch |
-3 | Latin-3, Südeuropäisch |
-4 | Latin-4, Nordeuropäisch |
-5 | Kyrillisch |
-6 | Arabisch |
-7 | Griechisch |
-8 | Hebräisch |
-9 | Latin-5, Türkisch |
-10 | Latin-6, Nordisch |
-11 | Thai |
(existiert nicht) | |
-13 | Latin-7, Baltisch |
-14 | Latin-8, Keltisch |
-15 | Latin-9, Westeuropäisch |
-16 | Latin-10, Südosteuropäisch |
ISO 8859-2, genauer ISO/IEC 8859-2, auch bekannt als Latin-2, ist ein von der ISO zuletzt 1999 aktualisierter Standard für die Informationstechnik zur Zeichenkodierung mit acht Bit und der zweite Teil der Normenfamilie ISO/IEC 8859. In modernen Anwendungen wird Unicode bevorzugt, üblicherweise kodiert als UTF-8. Die mitteleuropäischen Buchstaben sind auch in der europäischen Unicode-Teilmenge DIN 91379 enthalten.
Die mit sieben Bit kodierbaren Zeichen entsprechen US-ASCII mit führendem Nullbit. Zusätzlich zu den 95 darstellbaren ASCII-Zeichen (2016–7E16) kodiert ISO 8859-2 96 weitere (A016–FF16), also insgesamt 191 von theoretisch möglichen 256 (= 28). Den Positionen 0016–1F16 und 7F16–9F16 sind in ISO/IEC 8859 und damit ISO/IEC 8859-2 keine Zeichen zugewiesen. Dieser Bereich wurde bewusst freigehalten, um die entsprechenden Bytes für die Gerätesteuerung nutzen zu können oder sicherzustellen, dass diese bei einer unzureichend spezifizierten Codierung nicht in Konflikt mit solchen Steuerzeichen geraten. Die von der IANA definierte Bezeichnung ISO-8859-2 (mit Bindestrich) steht für die Kombination der Zeichen dieser Norm mit nicht darstellbaren Steuerzeichen gemäß ISO/IEC 6429. Im Mai 2024 verwenden weniger als 0,1 % aller Websites ISO 8859-2, Unicode mit UTF-8-Encoding wird von 98,2 % verwendet.[1]
ISO 8859-2 versucht, möglichst viele Sonderzeichen mittel- und teilweise südosteuropäischer, überwiegend slawischer Sprachen abzudecken, darunter folgende:
- Albanisch
- Bosnisch
- Deutsch
- Kroatisch
- Polnisch
- Rumänisch
- Serbisch (in lateinischen Zeichen)
- Serbokroatisch (in lateinischen Zeichen)
- Slowakisch
- Slowenisch
- Ober- und Niedersorbisch
- Tschechisch
- Ungarisch
Tabelle
[Bearbeiten | Quelltext bearbeiten]Code | …0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0… | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1… | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2… | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4… | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5… | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6… | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7… | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
8… | PAD | HOP | BPH | NBH | IND | NEL | SSA | ESA | HTS | HTJ | VTS | PLD | PLU | RI | SS2 | SS3 |
9… | DCS | PU1 | PU2 | STS | CCH | MW | SPA | EPA | SOS | SGCI | SCI | CSI | ST | OSC | PM | APC |
A… | NBSP | Ą | ˘ | Ł | ¤ | Ľ | Ś | § | ¨ | Š | Ş | Ť | Ź | SHY | Ž | Ż |
B… | ° | ą | ˛ | ł | ´ | ľ | ś | ˇ | ¸ | š | ş | ť | ź | ˝ | ž | ż |
C… | Ŕ | Á | Â | Ă | Ä | Ĺ | Ć | Ç | Č | É | Ę | Ë | Ě | Í | Î | Ď |
D… | Đ | Ń | Ň | Ó | Ô | Ő | Ö | × | Ř | Ů | Ú | Ű | Ü | Ý | Ţ | ß |
E… | ŕ | á | â | ă | ä | ĺ | ć | ç | č | é | ę | ë | ě | í | î | ď |
F… | đ | ń | ň | ó | ô | ő | ö | ÷ | ř | ů | ú | ű | ü | ý | ţ | ˙ |
SP (space) auf Position 2016 ist das Leerzeichen, NBSP (no-break space, auch non-breaking space) auf Position A016 ist das geschützte Leerzeichen und SHY (soft hyphen) an Position AD16 ist der bedingte Trennstrich, der normalerweise nur am Zeilenende sichtbar ist.
Einzelnachweise
[Bearbeiten | Quelltext bearbeiten]- ↑ Historical trends in the usage of character encodings for websites. Abgerufen am 26. Mai 2024.