ANSI-Zeichensätze: ISO-8859 Reihe sowie Win 1252

Der Zeichensatz ASCII umfasst 128 Bitmuster, die verschiedenen Zeichen zugeordnet wurden. Dieser wurde im Laufe der Zeit erweitert, da 128 Zeichen/Steuerzeichen in der EDV nicht genug waren. Bei den Entwürfen für eine Erweiterung hat ANSI (American National Standards Institute) mitgewirkt, weshalb einige Zeichensätze als ANSI bezeichnet werden, obwohl es einen solchen Zeichensatz nicht gibt. Häufig werden diese auch erweiterter ASCII-Zeichensatz genannt.

Die grundlegende Erweiterung von ASCII bestand darin, das achte Bit zu verwenden und die Anzahl der Bitmuster auf 256 zu verdoppeln. Da man bereits annahm, dass auch 256 Zeichen nicht genug sein werden, hat man die Erweiterung variabel gestaltet. Das achte Bit sollte abhängig vom Sprachraum genutzt werden können, sodass die Bitmuster im asiatischen Sprachraum anderen Zeichen zugeordnet werden als im westeuropäischen Sprachraum. Hierfür wurden verschiedene Codepages festgelegt, die mit ISO-8859 beginnen und am Ende eine Versionsnummer enthalten, z.B. ISO-8859-1 für den westeuropäischen Sprachraum. Die Versionsnummern wurden wie folgt zugeordnet.

  • 1: Westeuropäisch (Latin 1)
  • 2: Mitteleuropäisch (Latin 2)
  • 3: Südeuropäisch (Latin 3)
  • 4: Nordeuropäisch (Latin 4)
  • 5: Kyrillisch
  • 6: Arabisch
  • 7: Griechisch
  • 8: Hebräisch
  • 9: Türkisch (Latin 5)
  • 10: Nordisch (Latin 6)
  • 11: Thai
  • 12: Wurde nicht entwickelt, existiert daher nicht
  • 13: Baltisch (Latin 7)
  • 14: Keltisch (Latin 8)
  • 15: Westeuropäisch (Latin 9)
  • 16: Südosteuropäisch (Latin 10)

Daneben gibt es weitere 8-Bit Zeichensätze, die in dieselbe Kategorie eingeordnet werden. Dazu zählt CP1252, der im Betriebssystem Windows verwendet und häufig Win 1252 genannt wird. In der Windows-Konsole wird dagegen CP850 verwendet. Damit die Abwärtskompatibilität gewährleistet ist, sind die Zeichensätze von 0 bis 127 identisch wie ASCII. Darüber hinaus werden die Bitmuster für den jeweiligen Sprachraum unterschiedlich genutzt.

Eine Besonderheit gibt es bei den Positionen 128 bis 159. In ISO-8859-1 sind diese nicht belegt, in Win 1252 sind sie jedoch gewissen Zeichen zugeordnet, z.B. das Eurozeichen an Position 128. Wenn für eine Website als Zeichenkodierung ISO-8859-1 angegeben wird, dann wird das Eurozeichen trotzdem angezeigt, da in den HTML-Standards festgelegt wurde, dass in solchen Fällen die Zeichenkodierung ISO-8859-1 wie Win 1252 zu behandeln ist und die meisten Browser halten sich daran. In der Art und Weise verhalten sich viele andere Programme, sodass man ISO-8859-1 mit Win 1252 gleichsetzen kann, obwohl sie genau genommen nicht identisch sind. Aus der folgenden Tabelle können die Zeichen in Win 1252 entnommen werden.

8-Bit Zeichensatz Win 1252 für die Darstellung von 256 Zeichen.
Tabelle für 128 - 255, da 0-127 identisch wie der ASCII-Zeichensatz ist
HTML Dual Hex Dezimal Zeichen HTML Dual Hex Dezimal Zeichen
€ 10000000 80 128 À 11000000 C0 192 À
 10000001 81 129 Á 11000001 C1 193 Á
‚ 10000010 82 130 Â 11000010 C2 194 Â
ƒ 10000011 83 131 ƒ Ã 11000011 C3 195 Ã
„ 10000100 84 132 Ä 11000100 C4 196 Ä
… 10000101 85 133 Å 11000101 C5 197 Å
† 10000110 86 134 Æ 11000110 C6 198 Æ
‡ 10000111 87 135 Ç 11000111 C7 199 Ç
ˆ 10001000 88 136 ˆ È 11001000 C8 200 È
‰ 10001001 89 137 É 11001001 C9 201 É
Š 10001010 8A 138 Š Ê 11001010 CA 202 Ê
‹ 10001011 8B 139 Ë 11001011 CB 203 Ë
Œ 10001100 8C 140 Œ Ì 11001100 CC 204 Ì
 10001101 8D 141 Í 11001101 CD 205 Í
Ž 10001110 8E 142 Ž Î 11001110 CE 206 Î
 10001111 8F 143 Ï 11001111 CF 207 Ï
 10010000 90 144 Ð 11010000 D0 208 Ð
‘ 10010001 91 145 Ñ 11010001 D1 209 Ñ
’ 10010010 92 146 Ò 11010010 D2 210 Ò
“ 10010011 93 147 Ó 11010011 D3 211 Ó
” 10010100 94 148 Ô 11010100 D4 212 Ô
• 10010101 95 149 Õ 11010101 D5 213 Õ
– 10010110 96 150 Ö 11010110 D6 214 Ö
— 10010111 97 151 × 11010111 D7 215 ×
˜ 10011000 98 152 ˜ Ø 11011000 D8 216 Ø
™ 10011001 99 153 Ù 11011001 D9 217 Ù
š 10011010 9A 154 š Ú 11011010 DA 218 Ú
› 10011011 9B 155 Û 11011011 DB 219 Û
œ 10011100 9C 156 œ Ü 11011100 DC 220 Ü
 10011101 9D 157 Ý 11011101 DD 221 Ý
ž 10011110 9E 158 ž Þ 11011110 DE 222 Þ
Ÿ 10011111 9F 159 Ÿ ß 11011111 DF 223 ß
  10100000 A0 160 à 11100000 E0 224 à
¡ 10100001 A1 161 ¡ á 11100001 E1 225 á
¢ 10100010 A2 162 ¢ â 11100010 E2 226 â
£ 10100011 A3 163 £ ã 11100011 E3 227 ã
¤ 10100100 A4 164 ¤ ä 11100100 E4 228 ä
¥ 10100101 A5 165 ¥ å 11100101 E5 229 å
¦ 10100110 A6 166 ¦ æ 11100110 E6 230 æ
§ 10100111 A7 167 § ç 11100111 E7 231 ç
¨ 10101000 A8 168 ¨ è 11101000 E8 232 è
© 10101001 A9 169 © é 11101001 E9 233 é
ª 10101010 AA 170 ª ê 11101010 EA 234 ê
« 10101011 AB 171 « ë 11101011 EB 235 ë
¬ 10101100 AC 172 ¬ ì 11101100 EC 236 ì
­ 10101101 AD 173 í 11101101 ED 237 í
® 10101110 AE 174 ® î 11101110 EE 238 î
¯ 10101111 AF 175 ¯ ï 11101111 EF 239 ï
° 10110000 B0 176 ° ð 11110000 F0 240 ð
± 10110001 B1 177 ± ñ 11110001 F1 241 ñ
² 10110010 B2 178 ² ò 11110010 F2 242 ò
³ 10110011 B3 179 ³ ó 11110011 F3 243 ó
´ 10110100 B4 180 ´ ô 11110100 F4 244 ô
µ 10110101 B5 181 µ õ 11110101 F5 245 õ
¶ 10110110 B6 182 ö 11110110 F6 246 ö
· 10110111 B7 183 · ÷ 11110111 F7 247 ÷
¸ 10111000 B8 184 ¸ ø 11111000 F8 248 ø
¹ 10111001 B9 185 ¹ ù 11111001 F9 249 ù
º 10111010 BA 186 º ú 11111010 FA 250 ú
» 10111011 BB 187 » û 11111011 FB 251 û
¼ 10111100 BC 188 ¼ ü 11111100 FC 252 ü
½ 10111101 BD 189 ½ ý 11111101 FD 253 ý
¾ 10111110 BE 190 ¾ þ 11111110 FE 254 þ
¿ 10111111 BF 191 ¿ ÿ 11111111 FF 255 ÿ