Unicodeblock Tags
Der Unicodeblock Tags (engl.: Tags, U+E0000 bis U+E007F) enthält sogenannte Sprachtags. Diese wurden in Unicode 3.1 eingeführt und dienten ursprünglich dazu, die Textsprache, Schrift und Orthografie nach RFC 4646 in Nur-Text-Dateien anzugeben, z. B. um in einer Textdatei Kurz- und Langzeichen nebeneinander verwenden zu können. Sprachangaben werden mit dem einleitenden Sprachtag gestartet und dann mithilfe der Sprachtagzeichen der entsprechende Code angegeben. Die damit festgelegte Sprache wirkt sich auf sämtlichen nachfolgenden Text aus. Der schließende Sprachtag beendet die Sprachangabe.
Seit Unicode-Version 5.1 (aus dem Jahr 2008) wird von dieser Verwendung abgeraten, sie gilt als veraltet (engl. deprecated).[1]
Mit Unicode Version 8.0 wurden die Zeichen U+E0020 bis U+E007E wieder zugelassen, allerdings für neue allgemeinere Zwecke als nur zum Markieren der Sprache eines Textes.
Ab Version 9.0 wird von dieser Möglichkeit Gebrauch gemacht, und die Tag-Zeichen U+E0020 bis U+E007E bilden nun eine Sequenz von Modifier-Zeichen, welche bestimmten Emoji-Zeichen eine spezielle Bedeutung geben. Diese Sequenz wird mit dem Tag-Zeichen U+E007F abgeschlossen.
Bisher (bis Unicode 10.0) wurde nur ein einziger Typ von Sequenzen definiert: Das Zeichen U+1F3F4 (🏴 WAVING BLACK FLAG) kann durch eine Tag-Sequenz zu einer Landes- oder Regionen-Flagge modifiziert werden. Die Tag-Sequenz kodiert das Land bzw. die Region anhand der CLDR-Datenbank.
Beispiel: Der CLDR-Code für England ist GBENG (GB für Großbritannien, gefolgt von ENG für England). Die Flagge Englands kann nun als Emoji-Sequenz kodiert werden: <U+1F3F4> <U+E0067> <U+E0062> <U+E0065> <U+E006E> <U+E0067> <U+E007F> ergibt (wenn das Programm derartige Sequenzen bereits unterstützt): 🏴. Die anderen beiden subnationalen Flaggen mit breiter Unterstützung durch Software sind 🏴 Schottland und 🏴 Wales. Der vierte Landesteil des Vereinigten Königreichs, 🏴 Nordirland, besitzt hingegen keine Flagge und wird deshalb in der Regel mit der zuvor erwähnten schwarzen Flagge dargestellt statt der bei Sportveranstaltungen verwendeten Red Hand Flag of Ulster[2].
Anmerkung: Bereits seit Unicode 6.0 gibt es die Möglichkeit, Landesflaggen jeweils über Paare von Zeichen aus dem Bereich U+1F1E6 bis U+1F1FF darzustellen, siehe Unicodeblock Zusätzliche umschlossene alphanumerische Zeichen
Tabelle
Alle Zeichen haben die allgemeine Kategorie „Formatierzeichen“ und die bidirektionale Klasse „Neutrale Begrenzung“.
Unicodenummer | Zeichen (400 %) | Offizielle Bezeichnung | Beschreibung |
---|---|---|---|
U+E0001 (917505) | <format> | LANGUAGE TAG | Einleitendes Sprachtag |
U+E0020 (917536) | <format> | TAG SPACE | Sprachtag Leerzeichen |
U+E0021 (917537) | <format> | TAG EXCLAMATION MARK | Sprachtag Ausrufezeichen |
U+E0022 (917538) | <format> | TAG QUOTATION MARK | Sprachtag Anführungszeichen |
U+E0023 (917539) | <format> | TAG NUMBER SIGN | Sprachtag Rautezeichen |
U+E0024 (917540) | <format> | TAG DOLLAR SIGN | Sprachtag Dollarzeichen |
U+E0025 (917541) | <format> | TAG PERCENT SIGN | Sprachtag Prozentzeichen |
U+E0026 (917542) | <format> | TAG AMPERSAND | Sprachtag Et-Zeichen |
U+E0027 (917543) | <format> | TAG APOSTROPHE | Sprachtag Apostroph |
U+E0028 (917544) | <format> | TAG LEFT PARENTHESIS | Sprachtag linke Klammer |
U+E0029 (917545) | <format> | TAG RIGHT PARENTHESIS | Sprachtag rechte Klammer |
U+E002A (917546) | <format> | TAG ASTERISK | Sprachtag Sternchen |
U+E002B (917547) | <format> | TAG PLUS SIGN | Sprachtag Pluszeichen |
U+E002C (917548) | <format> | TAG COMMA | Sprachtag Komma |
U+E002D (917549) | <format> | TAG HYPHEN-MINUS | Sprachtag Bindestrich |
U+E002E (917550) | <format> | TAG FULL STOP | Sprachtag Punkt |
U+E002F (917551) | <format> | TAG SOLIDUS | Sprachtag Schrägstrich |
U+E0030 (917552) | <format> | TAG DIGIT ZERO | Sprachtag Ziffer Null |
U+E0031 (917553) | <format> | TAG DIGIT ONE | Sprachtag Ziffer Eins |
U+E0032 (917554) | <format> | TAG DIGIT TWO | Sprachtag Ziffer Zwei |
U+E0033 (917555) | <format> | TAG DIGIT THREE | Sprachtag Ziffer Drei |
U+E0034 (917556) | <format> | TAG DIGIT FOUR | Sprachtag Ziffer Vier |
U+E0035 (917557) | <format> | TAG DIGIT FIVE | Sprachtag Ziffer Fünf |
U+E0036 (917558) | <format> | TAG DIGIT SIX | Sprachtag Ziffer Sechs |
U+E0037 (917559) | <format> | TAG DIGIT SEVEN | Sprachtag Ziffer Sieben |
U+E0038 (917560) | <format> | TAG DIGIT EIGHT | Sprachtag Ziffer Acht |
U+E0039 (917561) | <format> | TAG DIGIT NINE | Sprachtag Ziffer Neun |
U+E003A (917562) | <format> | TAG COLON | Sprachtag Doppelpunkt |
U+E003B (917563) | <format> | TAG SEMICOLON | Sprachtag Semikolon |
U+E003C (917564) | <format> | TAG LESS-THAN SIGN | Sprachtag Kleiner-als-Zeichen |
U+E003D (917565) | <format> | TAG EQUALS SIGN | Sprachtag Gleichheitszeichen |
U+E003E (917566) | <format> | TAG GREATER-THAN SIGN | Sprachtag Größer-als-Zeichen |
U+E003F (917567) | <format> | TAG QUESTION MARK | Sprachtag Fragezeichen |
U+E0040 (917568) | <format> | TAG COMMERCIAL AT | Sprachtag Klammeraffe |
U+E0041 (917569) | <format> | TAG LATIN CAPITAL LETTER A | Sprachtag Lateinischer Großbuchstabe A |
U+E0042 (917570) | <format> | TAG LATIN CAPITAL LETTER B | Sprachtag Lateinischer Großbuchstabe B |
U+E0043 (917571) | <format> | TAG LATIN CAPITAL LETTER C | Sprachtag Lateinischer Großbuchstabe C |
U+E0044 (917572) | <format> | TAG LATIN CAPITAL LETTER D | Sprachtag Lateinischer Großbuchstabe D |
U+E0045 (917573) | <format> | TAG LATIN CAPITAL LETTER E | Sprachtag Lateinischer Großbuchstabe E |
U+E0046 (917574) | <format> | TAG LATIN CAPITAL LETTER F | Sprachtag Lateinischer Großbuchstabe F |
U+E0047 (917575) | <format> | TAG LATIN CAPITAL LETTER G | Sprachtag Lateinischer Großbuchstabe G |
U+E0048 (917576) | <format> | TAG LATIN CAPITAL LETTER H | Sprachtag Lateinischer Großbuchstabe H |
U+E0049 (917577) | <format> | TAG LATIN CAPITAL LETTER I | Sprachtag Lateinischer Großbuchstabe I |
U+E004A (917578) | <format> | TAG LATIN CAPITAL LETTER J | Sprachtag Lateinischer Großbuchstabe J |
U+E004B (917579) | <format> | TAG LATIN CAPITAL LETTER K | Sprachtag Lateinischer Großbuchstabe K |
U+E004C (917580) | <format> | TAG LATIN CAPITAL LETTER L | Sprachtag Lateinischer Großbuchstabe L |
U+E004D (917581) | <format> | TAG LATIN CAPITAL LETTER M | Sprachtag Lateinischer Großbuchstabe M |
U+E004E (917582) | <format> | TAG LATIN CAPITAL LETTER N | Sprachtag Lateinischer Großbuchstabe N |
U+E004F (917583) | <format> | TAG LATIN CAPITAL LETTER O | Sprachtag Lateinischer Großbuchstabe O |
U+E0050 (917584) | <format> | TAG LATIN CAPITAL LETTER P | Sprachtag Lateinischer Großbuchstabe P |
U+E0051 (917585) | <format> | TAG LATIN CAPITAL LETTER Q | Sprachtag Lateinischer Großbuchstabe Q |
U+E0052 (917586) | <format> | TAG LATIN CAPITAL LETTER R | Sprachtag Lateinischer Großbuchstabe R |
U+E0053 (917587) | <format> | TAG LATIN CAPITAL LETTER S | Sprachtag Lateinischer Großbuchstabe S |
U+E0054 (917588) | <format> | TAG LATIN CAPITAL LETTER T | Sprachtag Lateinischer Großbuchstabe T |
U+E0055 (917589) | <format> | TAG LATIN CAPITAL LETTER U | Sprachtag Lateinischer Großbuchstabe U |
U+E0056 (917590) | <format> | TAG LATIN CAPITAL LETTER V | Sprachtag Lateinischer Großbuchstabe V |
U+E0057 (917591) | <format> | TAG LATIN CAPITAL LETTER W | Sprachtag Lateinischer Großbuchstabe W |
U+E0058 (917592) | <format> | TAG LATIN CAPITAL LETTER X | Sprachtag Lateinischer Großbuchstabe X |
U+E0059 (917593) | <format> | TAG LATIN CAPITAL LETTER Y | Sprachtag Lateinischer Großbuchstabe Y |
U+E005A (917594) | <format> | TAG LATIN CAPITAL LETTER Z | Sprachtag Lateinischer Großbuchstabe Z |
U+E005B (917595) | <format> | TAG LEFT SQUARE BRACKET | Sprachtag eckige Klammer links |
U+E005C (917596) | <format> | TAG REVERSE SOLIDUS | Sprachtag umgekehrter Schrägstrich |
U+E005D (917597) | <format> | TAG RIGHT SQUARE BRACKET | Sprachtag eckige Klammer rechts |
U+E005E (917598) | <format> | TAG CIRCUMFLEX ACCENT | Sprachtag Zirkumflex |
U+E005F (917599) | <format> | TAG LOW LINE | Sprachtag Unterstrich |
U+E0060 (917600) | <format> | TAG GRAVE ACCENT | Sprachtag Gravis |
U+E0061 (917601) | <format> | TAG LATIN SMALL LETTER A | Sprachtag Lateinischer Kleinbuchstabe A |
U+E0062 (917602) | <format> | TAG LATIN SMALL LETTER B | Sprachtag Lateinischer Kleinbuchstabe B |
U+E0063 (917603) | <format> | TAG LATIN SMALL LETTER C | Sprachtag Lateinischer Kleinbuchstabe C |
U+E0064 (917604) | <format> | TAG LATIN SMALL LETTER D | Sprachtag Lateinischer Kleinbuchstabe D |
U+E0065 (917605) | <format> | TAG LATIN SMALL LETTER E | Sprachtag Lateinischer Kleinbuchstabe E |
U+E0066 (917606) | <format> | TAG LATIN SMALL LETTER F | Sprachtag Lateinischer Kleinbuchstabe F |
U+E0067 (917607) | <format> | TAG LATIN SMALL LETTER G | Sprachtag Lateinischer Kleinbuchstabe G |
U+E0068 (917608) | <format> | TAG LATIN SMALL LETTER H | Sprachtag Lateinischer Kleinbuchstabe H |
U+E0069 (917609) | <format> | TAG LATIN SMALL LETTER I | Sprachtag Lateinischer Kleinbuchstabe I |
U+E006A (917610) | <format> | TAG LATIN SMALL LETTER J | Sprachtag Lateinischer Kleinbuchstabe J |
U+E006B (917611) | <format> | TAG LATIN SMALL LETTER K | Sprachtag Lateinischer Kleinbuchstabe K |
U+E006C (917612) | <format> | TAG LATIN SMALL LETTER L | Sprachtag Lateinischer Kleinbuchstabe L |
U+E006D (917613) | <format> | TAG LATIN SMALL LETTER M | Sprachtag Lateinischer Kleinbuchstabe M |
U+E006E (917614) | <format> | TAG LATIN SMALL LETTER N | Sprachtag Lateinischer Kleinbuchstabe N |
U+E006F (917615) | <format> | TAG LATIN SMALL LETTER O | Sprachtag Lateinischer Kleinbuchstabe O |
U+E0070 (917616) | <format> | TAG LATIN SMALL LETTER P | Sprachtag Lateinischer Kleinbuchstabe P |
U+E0071 (917617) | <format> | TAG LATIN SMALL LETTER Q | Sprachtag Lateinischer Kleinbuchstabe Q |
U+E0072 (917618) | <format> | TAG LATIN SMALL LETTER R | Sprachtag Lateinischer Kleinbuchstabe R |
U+E0073 (917619) | <format> | TAG LATIN SMALL LETTER S | Sprachtag Lateinischer Kleinbuchstabe S |
U+E0074 (917620) | <format> | TAG LATIN SMALL LETTER T | Sprachtag Lateinischer Kleinbuchstabe T |
U+E0075 (917621) | <format> | TAG LATIN SMALL LETTER U | Sprachtag Lateinischer Kleinbuchstabe U |
U+E0076 (917622) | <format> | TAG LATIN SMALL LETTER V | Sprachtag Lateinischer Kleinbuchstabe V |
U+E0077 (917623) | <format> | TAG LATIN SMALL LETTER W | Sprachtag Lateinischer Kleinbuchstabe W |
U+E0078 (917624) | <format> | TAG LATIN SMALL LETTER X | Sprachtag Lateinischer Kleinbuchstabe X |
U+E0079 (917625) | <format> | TAG LATIN SMALL LETTER Y | Sprachtag Lateinischer Kleinbuchstabe Y |
U+E007A (917626) | <format> | TAG LATIN SMALL LETTER Z | Sprachtag Lateinischer Kleinbuchstabe Z |
U+E007B (917627) | <format> | TAG LEFT CURLY BRACKET | Sprachtag geschweifte Klammer links |
U+E007C (917628) | <format> | TAG VERTICAL LINE | Sprachtag senkrechter Strich |
U+E007D (917629) | <format> | TAG RIGHT CURLY BRACKET | Sprachtag geschweifte Klammer rechts |
U+E007E (917630) | <format> | TAG TILDE | Sprachtag Tilde |
U+E007F (917631) | <format> | CANCEL TAG | Schließendes Sprachtag |
Quellen
- Unicode 5.1.0 Eigenschaften
- Flag for Northern Ireland (GB-NIR) in Emojipedia (Vergleich der Darstellungen in verschiedenen Emoji-Sätzen, hier jedoch leer)
Weblinks
- PDF des Unicode-Konsortiums (englisch; 77 kB)