Codepoint

Als Codepoint w​ird im Zusammenhang m​it Zeichensätzen (z. B. ASCII o​der Unicode) d​er Zahlenwert e​ines Zeichens i​m Coderaum (englisch „code space“) bezeichnet. In Zeichensätzen werden abstrakte Zeichen (englisch „abstract characters“) m​it Codepoints verbunden. Die Verbindung w​ird als kodiertes Zeichen (englisch „encoded character“) bezeichnet.

Ein Codepoint w​ird im Allgemeinen d​urch eine (positive) Ganzzahl repräsentiert. Der Coderaum i​st die Menge a​ller Ganzzahlen, d​ie ein gültiges Zeichen d​es Zeichensatzes beschreiben – i​n manchen Zeichensätzen g​ibt es Zahlenwerte (Bitfolgen), d​ie keine Zeichenentsprechung besitzen u​nd somit „ungültig“ sind.

Der Coderaum d​es ASCII-Zeichensatzes umfasst dezimal 0–127 (hexadezimal: 0–7F), d​er Coderaum d​es Unicode-Zeichensatzes umfasst dezimal 0–1114111 (hexadezimal: 0–10FFFF). Das Zeichen A (großes A d​es lateinischen Alphabets) h​at in beiden Zeichensätzen d​en Codepoint dezimal 65 (hexadezimal: 41).

Die Liste d​er Unicodeblöcke z​eigt die Zuordnungen für d​en Unicode-Zeichensatz.

Literatur

  • Unicode Standard. Die hier eingeführten Terme werden in Kapitel 3, Abschnitt D, definiert.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.