Unicodeblock Tags

Der Unicodeblock Tags (engl.: Tags, U+E0000 bis U+E007F) enthält sogenannte Sprachtags. Diese wurden in Unicode 3.1 eingeführt und dienten ursprünglich dazu, die Textsprache, Schrift und Orthografie nach RFC 4646 in Nur-Text-Dateien anzugeben, z. B. um in einer Textdatei Kurz- und Langzeichen nebeneinander verwenden zu können. Sprachangaben werden mit dem einleitenden Sprachtag gestartet und dann mithilfe der Sprachtagzeichen der entsprechende Code angegeben. Die damit festgelegte Sprache wirkt sich auf sämtlichen nachfolgenden Text aus. Der schließende Sprachtag beendet die Sprachangabe.

Anwendungsbeispiel von Sprachtags

Seit Unicode-Version 5.1 (aus dem Jahr 2008) wird von dieser Verwendung abgeraten, sie gilt als veraltet (engl. deprecated).[1]

Mit Unicode Version 8.0 wurden die Zeichen U+E0020 bis U+E007E wieder zugelassen, allerdings für neue allgemeinere Zwecke als nur zum Markieren der Sprache eines Textes.

Ab Version 9.0 wird von dieser Möglichkeit Gebrauch gemacht, und die Tag-Zeichen U+E0020 bis U+E007E bilden nun eine Sequenz von Modifier-Zeichen, welche bestimmten Emoji-Zeichen eine spezielle Bedeutung geben. Diese Sequenz wird mit dem Tag-Zeichen U+E007F abgeschlossen.

Bisher (bis Unicode 10.0) wurde nur ein einziger Typ von Sequenzen definiert: Das Zeichen U+1F3F4 (🏴 WAVING BLACK FLAG) kann durch eine Tag-Sequenz zu einer Landes- oder Regionen-Flagge modifiziert werden. Die Tag-Sequenz kodiert das Land bzw. die Region anhand der CLDR-Datenbank.

Beispiel: Der CLDR-Code für England ist GBENG (GB für Großbritannien, gefolgt von ENG für England). Die Flagge Englands kann nun als Emoji-Sequenz kodiert werden: <U+1F3F4> <U+E0067> <U+E0062> <U+E0065> <U+E006E> <U+E0067> <U+E007F> ergibt (wenn das Programm derartige Sequenzen bereits unterstützt): 🏴󠁧󠁢󠁥󠁮󠁧󠁿. Die anderen beiden subnationalen Flaggen mit breiter Unterstützung durch Software sind 🏴󠁧󠁢󠁳󠁣󠁴󠁿 Schottland und 🏴󠁧󠁢󠁷󠁬󠁳󠁿 Wales. Der vierte Landesteil des Vereinigten Königreichs, 🏴󠁧󠁢󠁮󠁩󠁲󠁿 Nordirland, besitzt hingegen keine Flagge und wird deshalb in der Regel mit der zuvor erwähnten schwarzen Flagge dargestellt statt der bei Sportveranstaltungen verwendeten Red Hand Flag of Ulster[2].

Anmerkung: Bereits seit Unicode 6.0 gibt es die Möglichkeit, Landesflaggen jeweils über Paare von Zeichen aus dem Bereich U+1F1E6 bis U+1F1FF darzustellen, siehe Unicodeblock Zusätzliche umschlossene alphanumerische Zeichen

Tabelle

Alle Zeichen haben die allgemeine Kategorie „Formatierzeichen“ und die bidirektionale Klasse „Neutrale Begrenzung“.

UnicodenummerZeichen
(400 %)
Offizielle BezeichnungBeschreibung
U+E0001 (917505)<format>LANGUAGE TAGEinleitendes Sprachtag
U+E0020 (917536)<format>TAG SPACESprachtag Leerzeichen
U+E0021 (917537)<format>TAG EXCLAMATION MARKSprachtag Ausrufezeichen
U+E0022 (917538)<format>TAG QUOTATION MARKSprachtag Anführungszeichen
U+E0023 (917539)<format>TAG NUMBER SIGNSprachtag Rautezeichen
U+E0024 (917540)<format>TAG DOLLAR SIGNSprachtag Dollarzeichen
U+E0025 (917541)<format>TAG PERCENT SIGNSprachtag Prozentzeichen
U+E0026 (917542)<format>TAG AMPERSANDSprachtag Et-Zeichen
U+E0027 (917543)<format>TAG APOSTROPHESprachtag Apostroph
U+E0028 (917544)<format>TAG LEFT PARENTHESISSprachtag linke Klammer
U+E0029 (917545)<format>TAG RIGHT PARENTHESISSprachtag rechte Klammer
U+E002A (917546)<format>TAG ASTERISKSprachtag Sternchen
U+E002B (917547)<format>TAG PLUS SIGNSprachtag Pluszeichen
U+E002C (917548)<format>TAG COMMASprachtag Komma
U+E002D (917549)<format>TAG HYPHEN-MINUSSprachtag Bindestrich
U+E002E (917550)<format>TAG FULL STOPSprachtag Punkt
U+E002F (917551)<format>TAG SOLIDUSSprachtag Schrägstrich
U+E0030 (917552)<format>TAG DIGIT ZEROSprachtag Ziffer Null
U+E0031 (917553)<format>TAG DIGIT ONESprachtag Ziffer Eins
U+E0032 (917554)<format>TAG DIGIT TWOSprachtag Ziffer Zwei
U+E0033 (917555)<format>TAG DIGIT THREESprachtag Ziffer Drei
U+E0034 (917556)<format>TAG DIGIT FOURSprachtag Ziffer Vier
U+E0035 (917557)<format>TAG DIGIT FIVESprachtag Ziffer Fünf
U+E0036 (917558)<format>TAG DIGIT SIXSprachtag Ziffer Sechs
U+E0037 (917559)<format>TAG DIGIT SEVENSprachtag Ziffer Sieben
U+E0038 (917560)<format>TAG DIGIT EIGHTSprachtag Ziffer Acht
U+E0039 (917561)<format>TAG DIGIT NINESprachtag Ziffer Neun
U+E003A (917562)<format>TAG COLONSprachtag Doppelpunkt
U+E003B (917563)<format>TAG SEMICOLONSprachtag Semikolon
U+E003C (917564)<format>TAG LESS-THAN SIGNSprachtag Kleiner-als-Zeichen
U+E003D (917565)<format>TAG EQUALS SIGNSprachtag Gleichheitszeichen
U+E003E (917566)<format>TAG GREATER-THAN SIGNSprachtag Größer-als-Zeichen
U+E003F (917567)<format>TAG QUESTION MARKSprachtag Fragezeichen
U+E0040 (917568)<format>TAG COMMERCIAL ATSprachtag Klammeraffe
U+E0041 (917569)<format>TAG LATIN CAPITAL LETTER ASprachtag Lateinischer Großbuchstabe A
U+E0042 (917570)<format>TAG LATIN CAPITAL LETTER BSprachtag Lateinischer Großbuchstabe B
U+E0043 (917571)<format>TAG LATIN CAPITAL LETTER CSprachtag Lateinischer Großbuchstabe C
U+E0044 (917572)<format>TAG LATIN CAPITAL LETTER DSprachtag Lateinischer Großbuchstabe D
U+E0045 (917573)<format>TAG LATIN CAPITAL LETTER ESprachtag Lateinischer Großbuchstabe E
U+E0046 (917574)<format>TAG LATIN CAPITAL LETTER FSprachtag Lateinischer Großbuchstabe F
U+E0047 (917575)<format>TAG LATIN CAPITAL LETTER GSprachtag Lateinischer Großbuchstabe G
U+E0048 (917576)<format>TAG LATIN CAPITAL LETTER HSprachtag Lateinischer Großbuchstabe H
U+E0049 (917577)<format>TAG LATIN CAPITAL LETTER ISprachtag Lateinischer Großbuchstabe I
U+E004A (917578)<format>TAG LATIN CAPITAL LETTER JSprachtag Lateinischer Großbuchstabe J
U+E004B (917579)<format>TAG LATIN CAPITAL LETTER KSprachtag Lateinischer Großbuchstabe K
U+E004C (917580)<format>TAG LATIN CAPITAL LETTER LSprachtag Lateinischer Großbuchstabe L
U+E004D (917581)<format>TAG LATIN CAPITAL LETTER MSprachtag Lateinischer Großbuchstabe M
U+E004E (917582)<format>TAG LATIN CAPITAL LETTER NSprachtag Lateinischer Großbuchstabe N
U+E004F (917583)<format>TAG LATIN CAPITAL LETTER OSprachtag Lateinischer Großbuchstabe O
U+E0050 (917584)<format>TAG LATIN CAPITAL LETTER PSprachtag Lateinischer Großbuchstabe P
U+E0051 (917585)<format>TAG LATIN CAPITAL LETTER QSprachtag Lateinischer Großbuchstabe Q
U+E0052 (917586)<format>TAG LATIN CAPITAL LETTER RSprachtag Lateinischer Großbuchstabe R
U+E0053 (917587)<format>TAG LATIN CAPITAL LETTER SSprachtag Lateinischer Großbuchstabe S
U+E0054 (917588)<format>TAG LATIN CAPITAL LETTER TSprachtag Lateinischer Großbuchstabe T
U+E0055 (917589)<format>TAG LATIN CAPITAL LETTER USprachtag Lateinischer Großbuchstabe U
U+E0056 (917590)<format>TAG LATIN CAPITAL LETTER VSprachtag Lateinischer Großbuchstabe V
U+E0057 (917591)<format>TAG LATIN CAPITAL LETTER WSprachtag Lateinischer Großbuchstabe W
U+E0058 (917592)<format>TAG LATIN CAPITAL LETTER XSprachtag Lateinischer Großbuchstabe X
U+E0059 (917593)<format>TAG LATIN CAPITAL LETTER YSprachtag Lateinischer Großbuchstabe Y
U+E005A (917594)<format>TAG LATIN CAPITAL LETTER ZSprachtag Lateinischer Großbuchstabe Z
U+E005B (917595)<format>TAG LEFT SQUARE BRACKETSprachtag eckige Klammer links
U+E005C (917596)<format>TAG REVERSE SOLIDUSSprachtag umgekehrter Schrägstrich
U+E005D (917597)<format>TAG RIGHT SQUARE BRACKETSprachtag eckige Klammer rechts
U+E005E (917598)<format>TAG CIRCUMFLEX ACCENTSprachtag Zirkumflex
U+E005F (917599)<format>TAG LOW LINESprachtag Unterstrich
U+E0060 (917600)<format>TAG GRAVE ACCENTSprachtag Gravis
U+E0061 (917601)<format>TAG LATIN SMALL LETTER ASprachtag Lateinischer Kleinbuchstabe A
U+E0062 (917602)<format>TAG LATIN SMALL LETTER BSprachtag Lateinischer Kleinbuchstabe B
U+E0063 (917603)<format>TAG LATIN SMALL LETTER CSprachtag Lateinischer Kleinbuchstabe C
U+E0064 (917604)<format>TAG LATIN SMALL LETTER DSprachtag Lateinischer Kleinbuchstabe D
U+E0065 (917605)<format>TAG LATIN SMALL LETTER ESprachtag Lateinischer Kleinbuchstabe E
U+E0066 (917606)<format>TAG LATIN SMALL LETTER FSprachtag Lateinischer Kleinbuchstabe F
U+E0067 (917607)<format>TAG LATIN SMALL LETTER GSprachtag Lateinischer Kleinbuchstabe G
U+E0068 (917608)<format>TAG LATIN SMALL LETTER HSprachtag Lateinischer Kleinbuchstabe H
U+E0069 (917609)<format>TAG LATIN SMALL LETTER ISprachtag Lateinischer Kleinbuchstabe I
U+E006A (917610)<format>TAG LATIN SMALL LETTER JSprachtag Lateinischer Kleinbuchstabe J
U+E006B (917611)<format>TAG LATIN SMALL LETTER KSprachtag Lateinischer Kleinbuchstabe K
U+E006C (917612)<format>TAG LATIN SMALL LETTER LSprachtag Lateinischer Kleinbuchstabe L
U+E006D (917613)<format>TAG LATIN SMALL LETTER MSprachtag Lateinischer Kleinbuchstabe M
U+E006E (917614)<format>TAG LATIN SMALL LETTER NSprachtag Lateinischer Kleinbuchstabe N
U+E006F (917615)<format>TAG LATIN SMALL LETTER OSprachtag Lateinischer Kleinbuchstabe O
U+E0070 (917616)<format>TAG LATIN SMALL LETTER PSprachtag Lateinischer Kleinbuchstabe P
U+E0071 (917617)<format>TAG LATIN SMALL LETTER QSprachtag Lateinischer Kleinbuchstabe Q
U+E0072 (917618)<format>TAG LATIN SMALL LETTER RSprachtag Lateinischer Kleinbuchstabe R
U+E0073 (917619)<format>TAG LATIN SMALL LETTER SSprachtag Lateinischer Kleinbuchstabe S
U+E0074 (917620)<format>TAG LATIN SMALL LETTER TSprachtag Lateinischer Kleinbuchstabe T
U+E0075 (917621)<format>TAG LATIN SMALL LETTER USprachtag Lateinischer Kleinbuchstabe U
U+E0076 (917622)<format>TAG LATIN SMALL LETTER VSprachtag Lateinischer Kleinbuchstabe V
U+E0077 (917623)<format>TAG LATIN SMALL LETTER WSprachtag Lateinischer Kleinbuchstabe W
U+E0078 (917624)<format>TAG LATIN SMALL LETTER XSprachtag Lateinischer Kleinbuchstabe X
U+E0079 (917625)<format>TAG LATIN SMALL LETTER YSprachtag Lateinischer Kleinbuchstabe Y
U+E007A (917626)<format>TAG LATIN SMALL LETTER ZSprachtag Lateinischer Kleinbuchstabe Z
U+E007B (917627)<format>TAG LEFT CURLY BRACKETSprachtag geschweifte Klammer links
U+E007C (917628)<format>TAG VERTICAL LINESprachtag senkrechter Strich
U+E007D (917629)<format>TAG RIGHT CURLY BRACKETSprachtag geschweifte Klammer rechts
U+E007E (917630)<format>TAG TILDESprachtag Tilde
U+E007F (917631)<format>CANCEL TAGSchließendes Sprachtag

Quellen

  1. Unicode 5.1.0 Eigenschaften
  2. Flag for Northern Ireland (GB-NIR) in Emojipedia (Vergleich der Darstellungen in verschiedenen Emoji-Sätzen, hier jedoch leer)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.