Sql-und-Xml-Home Xml lernen Unicode: Block und Kategorie Unicode-Datenbank

Die Unicode-Datenbank

Offline-Variante als Windows-CHM-Datei (Version 1.0.0, 1.2 MB).

Übersicht:

1. Liste aller Unicode-Blockbereiche

In den beiden folgenden Tabellen sind alle Unicode-Blöcke, geordnet nach Codepunkten, aufgeführt. Die Spalte 'Blockname' enthält den offiziellen englischen Namen dieses Blocks, Beginn und Ende sind in hexadezimaler und Zahldarstellung genannt. Cn ist das Kürzel für die Kategorie Other, not Assigned, diesen Codepunkten ist keine Darstellung bzw. Funktion zugewiesen. Die Spalte 'def' enthält die Zahl der verwendbaren Codepunkte und entspricht der Zahl der Codepunkte in diesem Block abzüglich Cn. Die Spalte 'NET' teilt die Zahl der von .NET1.1 erkannten Unicode-Zeichen in diesem Block mit. Die Unicode-Datenbank basiert auf der Version 4.0, .NET1.1 legt Unicode.3.1 zugrunde, so daß von .NET nicht alle Zeichen in bezug auf Kategorien korrekt verarbeitet werden. Die nicht erkannten Zeichen werden in RegEx-Suchmustern der Form '\{IsUnicode-Block}' fälschlich negativ bewertet. Gibt es in einem Block solche Zeichen (also 'def.' > 'NET'), so ist die Zelle rötlich unterlegt, der Block enthält Zeichen ab Version 3.2. Das folgende Y/N sagt aus, ob man den Blocknamen ohne Leerzeichen in RegEx-patterns verwenden kann. Falls Y, gelingt dies mit vorangestelltem 'Is', etwa '\p{IsBasicLatin}' oder '\p{IsBopomofo}'. Die korrekten Werte wurden durch probeweises Einsetzen ermittelt. Es folgen Spalten mit der Zahl der Zeichen pro Block aus einer bestimmten Unicode-Version. Die erste Tabelle enthält alle Blöcke aus der basic multilingual plane, die zweite Tabelle enthält die Unicode-Zeichen mit Codepunkten oberhalb FFFF. Diese sind mit aktuellen Browsern noch nicht über die Codierung &#x[Unicode-Word]; sowie einen Font darstellbar. Für sie wurden keine gesonderten Detail-Tabellen erstellt, da die Tabellen bloß Namen und Kategorien enthalten würden. Auf verweisende Links und die Spalte 'NET' wurde ebenfalls verzichtet. Die letzte Spalte enthält die Größe der Detail-Datei in KB. Zeilen mit dem Eintrag 'No_Block (unused)' bezeichnen nicht belegte Blöcke. Die Nummer in der ersten Spalte und der Wechsel zwischen weißem und grauem Hintergrund wurden nur zur besseren Darstellung eingefügt und haben keine offizielle Bedeutung.
Bei den angegebenen Summen ist zu beachten, daß die Blöcke CJK Unified Ideographs Extension A, CJK Unified Ideographs und Hangul Syllables nicht in die Detaildarstellung übernommen wurden. Zwar liegen für diese von Unicode.org gezippte Dateien vor. Jedoch sind diese Zeichensätze extrem groß, so daß sie bislang nicht übernommen wurden. Analog entfällt für den privaten Bereich Private Use Area die Darstellung. Die Gesamtzahl der definierten Codepunkte unterscheidet sich deshalb von den offiziellen Zahlen und wäre um die Zahl der Codepunkte <> Cn in diesen Blöcken zu vergrößern.
Als kleinen Zusatz gibt es zwei Online-Tools: Der Int/Hex/Char-Converter rechnet Integer-Darstellung, Hexadezimal-Ausdruck und Codepunkt ineinander um. Der Entity-Generator codiert Klartext in Entity-Darstellungen, entweder als Integer- (A = &#65;) oder als Hex-Version (A = &#x41;). Eine Mailadresse wird mit 'mailto' ergänzt und mit dem korrekten umgebenden Html-Code versehen, so daß ein Klick im Browser weiterhin das Mailprogramm startet, einfache EMail-Spam-Bots an dieser Darstellung jedoch scheitern.

1.1 Codepunkte der Basic multilingual plane <= FFFF

NrBlocknameBeginn (hex/int)Ende (hex/int)BlocklängedefCnNET2.13.03.13.24.0Größe
1Basic Latin0000 (0)007F (127)1281280128 / Y128000025,5 KB
2Latin-1 Supplement0080 (128)00FF (255)1281280127 / Y128000026,7 KB
3Latin Extended-A0100 (256)017F (383)1281280128 / Y128000027 KB
4Latin Extended-B0180 (384)024F (591)20818325183 / Y1483001438 KB
5IPA Extensions0250 (592)02AF (687)9696095 / Y89500220,5 KB
6Spacing Modifier Letters02B0 (688)02FF (767)8080080 / Y576001717,4 KB
7Combining Diacritical Marks0300 (768)036F (879)1121075107 / Y72100141122,5 KB
8Greek and Coptic0370 (880)03FF (1023)14412024120 / Y105523525 KB
9Cyrillic0400 (1024)04FF (1279)25624610246 / Y2261208050,2 KB
10Cyrillic Supplement0500 (1280)052F (1327)48163216 / Y0001605,3 KB
11Armenian0530 (1328)058F (1423)96861086 / Y85100018,5 KB
12Hebrew0590 (1424)05FF (1535)112823082 / Y82000017,3 KB
13Arabic0600 (1536)06FF (1791)25622729227 / Y19412021945,6 KB
14Syriac0700 (1792)074F (1871)8077377 / Y07100616,5 KB

No_Block (unused)
15Thaana0780 (1920)07BF (1983)64501450 / Y04901011,2 KB

No_Block (unused)
16Devanagari0900 (2304)097F (2431)12810523105 / Y104000121,8 KB
17Bengali0980 (2432)09FF (2559)128903890 / Y89000119 KB
18Gurmukhi0A00 (2560)0A7F (2687)128775177 / Y75000216,2 KB
19Gujarati0A80 (2688)0AFF (2815)128834583 / Y78000517,5 KB
20Oriya0B00 (2816)0B7F (2943)128814781 / Y79000216,8 KB
NrBlocknameBeginn (hex/int)Ende (hex/int)BlocklängedefCnNET2.13.03.13.24.0Größe
21Tamil0B80 (2944)0BFF (3071)128695969 / Y61000814,9 KB
22Telugu0C00 (3072)0C7F (3199)128804880 / Y80000016,7 KB
23Kannada0C80 (3200)0CFF (3327)128824682 / Y80000217,1 KB
24Malayalam0D00 (3328)0D7F (3455)128785078 / Y78000016,5 KB
25Sinhala0D80 (3456)0DFF (3583)128804880 / Y08000017,6 KB
26Thai0E00 (3584)0E7F (3711)128874187 / Y87000018,5 KB
27Lao0E80 (3712)0EFF (3839)128656365 / Y65000013,8 KB
28Tibetan0F00 (3840)0FFF (4095)25619363193 / Y1682500039 KB
29Myanmar1000 (4096)109F (4255)160788278 / Y07800016,5 KB
30Georgian10A0 (4256)10FF (4351)96801680 / Y78002017 KB
31Hangul Jamo1100 (4352)11FF (4607)25624016240 / Y240000047 KB
32Ethiopic1200 (4608)137F (4991)38434539336 / Y034500065,4 KB

No_Block (unused)
33Cherokee13A0 (5024)13FF (5119)96851185 / Y08500017,3 KB
34Unified Canadian Aboriginal Syllabics1400 (5120)167F (5759)64063010630 / Y0630000121,1 KB
35Ogham1680 (5760)169F (5791)3229329 / Y0290007,5 KB
36Runic16A0 (5792)16FF (5887)96811581 / Y08100017,1 KB
37Tagalog1700 (5888)171F (5919)32201220 / Y0002005,7 KB
38Hanunoo1720 (5920)173F (5951)3223923 / Y0002306,4 KB
39Buhid1740 (5952)175F (5983)32201220 / Y0002005,6 KB
40Tagbanwa1760 (5984)177F (6015)32181418 / Y0001805,4 KB
NrBlocknameBeginn (hex/int)Ende (hex/int)BlocklängedefCnNET2.13.03.13.24.0Größe
41Khmer1780 (6016)17FF (6143)12811414114 / Y0103001123,5 KB
42Mongolian1800 (6144)18AF (6319)17615521155 / Y015500031,6 KB

No_Block (unused)
43Limbu1900 (6400)194F (6479)80661466 / Y00006614,3 KB
44Tai Le1950 (6480)197F (6527)48351335 / Y0000358,2 KB

No_Block (unused)
45Khmer Symbols19E0 (6624)19FF (6655)3232032 / Y0000328 KB

No_Block (unused)
46Phonetic Extensions1D00 (7424)1D7F (7551)12810820108 / Y000010822,7 KB

No_Block (unused)
47Latin Extended Additional1E00 (7680)1EFF (7935)25624610246 / Y246000051,8 KB
48Greek Extended1F00 (7936)1FFF (8191)25623323233 / Y233000050,6 KB
49General Punctuation2000 (8192)206F (8303)112971597 / Y767012220,6 KB
50Superscripts and Subscripts2070 (8304)209F (8351)48291929 / Y2800107,8 KB
51Currency Symbols20A0 (8352)20CF (8399)48183018 / Y1330205,2 KB
52Combining Diacritical Marks for Symbols20D0 (8400)20FF (8447)48272127 / Y1820707,6 KB
53Letterlike Symbols2100 (8448)214F (8527)8075574 / Y572015116 KB
54Number Forms2150 (8528)218F (8591)64491548 / Y48100011,3 KB
55Arrows2190 (8592)21FF (8703)1121120112 / Y919012023,4 KB
56Mathematical Operators2200 (8704)22FF (8959)2562560256 / Y2420014048,7 KB
57Miscellaneous Technical2300 (8960)23FF (9215)25620947206 / Y12232053242 KB
58Control Pictures2400 (9216)243F (9279)64392539 / Y3720009,3 KB
59Optical Character Recognition2440 (9280)245F (9311)32112111 / Y1100004,1 KB
60Enclosed Alphanumerics2460 (9312)24FF (9471)1601600160 / Y1390020132,5 KB
NrBlocknameBeginn (hex/int)Ende (hex/int)BlocklängedefCnNET2.13.03.13.24.0Größe
61Box Drawing2500 (9472)257F (9599)1281280128 / Y128000027,8 KB
62Block Elements2580 (9600)259F (9631)3232032 / Y22001008,1 KB
63Geometric Shapes25A0 (9632)25FF (9727)9696096 / Y80808020,4 KB
64Miscellaneous Symbols2600 (9728)26FF (9983)256145111145 / Y10630241228,1 KB
65Dingbats2700 (9984)27BF (10175)19217418174 / Y1600014036 KB
66Miscellaneous Mathematical Symbols-A27C0 (10176)27EF (10223)48282028 / Y0002807,7 KB
67Supplemental Arrows-A27F0 (10224)27FF (10239)1616016 / Y0001605,2 KB
68Braille Patterns2800 (10240)28FF (10495)2562560256 / Y025600050,1 KB
69Supplemental Arrows-B2900 (10496)297F (10623)1281280128 / Y000128028 KB
70Miscellaneous Mathematical Symbols-B2980 (10624)29FF (10751)1281280128 / Y000128026,9 KB
71Supplemental Mathematical Operators2A00 (10752)2AFF (11007)2562560256 / Y000256051,7 KB
72Miscellaneous Symbols and Arrows2B00 (11008)2BFF (11263)2561424214 / Y0000144,8 KB

No_Block (unused)
73CJK Radicals Supplement2E80 (11904)2EFF (12031)12811513115 / Y011500023,4 KB
74Kangxi Radicals2F00 (12032)2FDF (12255)22421410214 / Y021400041,4 KB

No_Block (unused)
75Ideographic Description Characters2FF0 (12272)2FFF (12287)1612412 / Y0120004,8 KB
76CJK Symbols and Punctuation3000 (12288)303F (12351)6464064 / Y57403015,1 KB
77Hiragana3040 (12352)309F (12447)9693393 / Y90003019,3 KB
78Katakana30A0 (12448)30FF (12543)9696095 / Y94002019,8 KB
79Bopomofo3100 (12544)312F (12591)4840840 / Y4000009,2 KB
80Hangul Compatibility Jamo3130 (12592)318F (12687)9694294 / Y94000019,5 KB
NrBlocknameBeginn (hex/int)Ende (hex/int)BlocklängedefCnNET2.13.03.13.24.0Größe
81Kanbun3190 (12688)319F (12703)1616016 / Y1600005,2 KB
82Bopomofo Extended31A0 (12704)31BF (12735)3224824 / Y0240006,5 KB

No_Block (unused)
83Katakana Phonetic Extensions31F0 (12784)31FF (12799)1616016 / Y0001605,2 KB
84Enclosed CJK Letters and Months3200 (12800)32FF (13055)25624115241 / Y2020030947,4 KB
85CJK Compatibility3300 (13056)33FF (13311)2562560256 / Y249000748,6 KB
86CJK Unified Ideographs Extension A3400 (13312)4DBF (19903)65926582102 / Y065820002,6 KB
87Yijing Hexagram Symbols4DC0 (19904)4DFF (19967)6464064 / Y00006414,2 KB
88CJK Unified Ideographs4E00 (19968)9FFF (40959)2099220902902 / Y2090200002,5 KB
89Yi SyllablesA000 (40960)A48F (42127)1168116531164 / Y01165000209,4 KB
90Yi RadicalsA490 (42128)A4CF (42191)6455955 / Y05005011,8 KB

No_Block (unused)
91Hangul SyllablesAC00 (44032)D7AF (55215)1118411172122 / Y1117200002,5 KB

No_Block (unused)
92High SurrogatesD800 (55296)DB7F (56191)89689602 / Y89600002,5 KB
93High Private Use SurrogatesDB80 (56192)DBFF (56319)12812802 / Y12800002,6 KB
94Low SurrogatesDC00 (56320)DFFF (57343)1024102402 / Y102400002,5 KB
95Private Use AreaE000 (57344)F8FF (63743)6400640002 / Y640000002,5 KB
96CJK Compatibility IdeographsF900 (63744)FAFF (64255)512361151361 / Y3020059072,4 KB
97Alphabetic Presentation FormsFB00 (64256)FB4F (64335)80582258 / Y57100013,6 KB
98Arabic Presentation Forms-AFB50 (64336)FDFF (65023)68859593595 / Y5930011125,8 KB
99Variation SelectorsFE00 (65024)FE0F (65039)1616016 / Y0001605,1 KB

No_Block (unused)
100Combining Half MarksFE20 (65056)FE2F (65071)164124 / Y400002,9 KB
NrBlocknameBeginn (hex/int)Ende (hex/int)BlocklängedefCnNET2.13.03.13.24.0Größe
101CJK Compatibility FormsFE30 (65072)FE4F (65103)3232032 / Y2800229,1 KB
102Small Form VariantsFE50 (65104)FE6F (65135)3226626 / Y2600007,3 KB
103Arabic Presentation Forms-BFE70 (65136)FEFF (65279)1441413141 / Y140001029,9 KB
104Halfwidth and Fullwidth FormsFF00 (65280)FFEF (65519)24022515224 / Y223002046,3 KB
105SpecialsFFF0 (65520)FFFF (65535)165115 / Y230003,1 KB
∑ 6142459177224712068474001030721016452

1.2 Codepunkte oberhalb der basic multilingual plane > FFFF

NrBlocknameBeginn (hex/int)Ende (hex/int)BlocklängedefCn2.13.03.13.24.0
106Linear B Syllabary10000 (65536)1007F (65663)1288840000088
107Linear B Ideograms10080 (65664)100FF (65791)12812350000123
108Aegean Numbers10100 (65792)1013F (65855)64577000057
109Old Italic10300 (66304)1032F (66351)483513003500
110Gothic10330 (66352)1034F (66383)32275002700
111Ugaritic10380 (66432)1039F (66463)32311000031
112Deseret10400 (66560)1044F (66639)80800007604
113Shavian10450 (66640)1047F (66687)48480000048
114Osmanya10480 (66688)104AF (66735)48408000040
115Cypriot Syllabary10800 (67584)1083F (67647)64559000055
116Byzantine Musical Symbols1D000 (118784)1D0FF (119039)256246100024600
117Musical Symbols1D100 (119040)1D1FF (119295)256219370021900
118Tai Xuan Jing Symbols1D300 (119552)1D35F (119647)96879000087
119Mathematical Alphanumeric Symbols1D400 (119808)1D7FF (120831)1024992320099101
120CJK Unified Ideographs Extension B20000 (131072)2A6DF (173791)4272024271800200
121CJK Compatibility Ideographs Supplement2F800 (194560)2FA1F (195103)54454220054200
122TagsE0000 (917504)E007F (917631)1289731009700
123Variation Selectors SupplementE0100 (917760)E01EF (917999)24024000000240
124Supplementary Private Use Area-AF0000 (983040)FFFFF (1048575)6553626553402000
125Supplementary Private Use Area-B100000 (1048576)10FFFF (1114111)6553626553402000
∑ 17700830131739950422350774

2. Unicode - Kategorien - General Category Values

Die folgende Tabelle fasst die Unicode-Kategorien zusammen. Auf die Spalten der Kurz- und Langformen folgen Angaben, wie häufig Zeichen dieser Kategorie im 2-Byte bzw. im 4-Byte - Zeichensatz auftreten, ferner die Gesamtsumme. Die durch den Link erreichbaren Einzelauflistungen stellen, quer über alle Blöcke, alle Zeichen dieser Kategorie zusammen und enthalten Links zu den Blockdateien. Hierbei sind nur die Zeichen der base multilingual plane berücksichtigt. Die Spalte 'NET-Id' enthält die Zahldarstellung dieser Kategorie innerhalb .NET, welche mit der Char.GetUnicodeCategory() - Methode zu jedem Zeichen ermittelt werden kann. Die Kurzformen der Kategorien können in RegEx-patterns verwendet werden: \p{Mn} findet alle Zeichen ohne horizontalen Vorschub.
NrKurzformengl. Langform<= FFFF> FFFFGesamtNETNET-Id2.13.03.13.24.0Größe
1LuLetter, Uppercase707483119070706652148217596,6 KB
2LlLetter, Lowercase88652914158851774305271965120,6 KB
3LtLetter, Titlecase310313123100006,4 KB
4LmLetter, Modifier11401141143563015416,5 KB
5LoLetter, Other546397564385462425442684601155454687,6 KB
6MnMark, Nonspacing530262792530535199224627469 KB
7McMark, Spacing Combining131813913168431801617,9 KB
8MeMark, Enclosing10010107540102,8 KB
9NdNumber, Decimal Digit208602681998159395002026,7 KB
10NlNumber, Letter521535194571007,9 KB
11NoNumber, Other2424929124210170114505632,5 KB
12PcPunctuation, Connector1201210181100013,1 KB
13PdPunctuation, Dash1701717191420103,8 KB
14PsPunctuation, Open650656420371026110,8 KB
15PePunctuation, Close640646321361026110,8 KB
16PiPunctuation, Initial quote606622600002,3 KB
17PfPunctuation, Final quote404423400002 KB
18PoPunctuation, Other19932021982412756012726,4 KB
19SmSymbol, Math88910899889252990105900116,2 KB
20ScSymbol, Currency3603636262740325,9 KB
21SkSymbol, Modifier740747427525001710,8 KB
22SoSymbol, Other22215242745222028128572042764249281,4 KB
23ZsSeparator, Space1801818111430103,9 KB
24ZlSeparator, Line101112100001,5 KB
25ZpSeparator, Paragraph101113100001,5 KB
26CcOther, Control6506565146500008,7 KB
27CfOther, Format331051383215196105445,6 KB
28CsOther, Surrogate606616600002,3 KB
29CoOther, Private Use246217240001,6 KB
30CnOther, Not Assigned224717399517624222900000no file
∑ 1433417700819134212068

3. Zusätzliche Eigenschaften / Properties, die Codepunkte zusammenfassen

Diese Tabelle enthält zusätzliche Eigenschaften, die nur für einige Zeichen definiert sind. Jeder Codepunkt gehört zu genau einem Block und einer Kategorie, muß jedoch keine oder kann mehrere erweiterte Properties haben.
NrPropertyAnmerkungAnzahlGröße
1Bidi_ControlElemente der Other, Format-Kategorie mit spezieller Bedeutung innerhalb des bidirektionalen Algorithmus73,2 KB
2Join_ControlFormatkontroll-Zeichen22,3 KB
3DashAlle Zeichen, die als Gedankenstrich / Minuszeichen / Dash in Unicode verwendet werden, einschließlich äquivalenter Darstellungen. Die meisten gehören zu Punctuation, Dash bzw. zum Block General Punctuation, manche stammen aus anderen Bereichen206,6 KB
4HyphenJene als Dash verwendete Zeichen, die eine Verbindung zwischen zwei Worten kennzeichnen sowie der 'KATAKANA MIDDLE DOT'104,7 KB
5Quotation_MarkZeichen, die als Anführungszeichen verwendet werden können. Eine genauere Aufteilung in öffnende und schließende Anführungszeichen wird durch die Kategorien Pi und Pf bereitgestellt298,2 KB
6Terminal_PunctuationZeichen, die das Ende textueller Einheiten markieren, einen Satz abschließen8618 KB
7Other_Mathsonstige mathematische Zeichen11723,7 KB
8Hex_DigitZeichen für hexadezimale Zahlen (ASCII_Hex_Digit) und äquivalente Darstellungen aus anderen Blöcken449,3 KB
9ASCII_Hex_DigitASCII-Zeichen, die für die Darstellung hexadezimaler Zahlen verwendet werden225,6 KB
10Other_Alphabeticweitere alphabetische Zeichen42873 KB
11DiacriticZeichen, welche die Bedeutung eines anderen Zeichens modifizieren, dem sie zugeordnet sind. Manche diakritischen Zeichen sind keine Kombinationszeichen, manche Kombinationszeichen sind keine diakritischen Zeichen45478,9 KB
12ExtenderZeichen, die den Wert oder die Form eines voranstehenden alphabetischen Zeichens erweitern196,5 KB
13Other_Lowercaseandere Kleinbuchstaben11421,7 KB
14Other_Uppercaseandere Großbuchstaben429,1 KB
15Noncharacter_Code_PointCodepunkte, die explizit für die Codierung von Zeichen verboten sind. Diesen Codepunkten ist weder Name noch Version zugeordnet, sie fehlen in der UnicodeData.txt346 KB
16Other_Grapheme_ExtendWeitere Zeichen, um die Eigenschaft Grapheme_Extend zu bilden. Wird genutzt, um die Grenzen von graphischer Zeichen, damit die Textgrenzen zu bestimmen155,2 KB
17Grapheme_Linkwird verwendet, um bei Default-Graphemen die Textgrenzen zu bestimmen145,7 KB
18IDS_Binary_Operatorverwendet in 'Ideographic Description Sequences'104,1 KB
19IDS_Trinary_Operatorverwendet in 'Ideographic Description Sequences'22,5 KB
20Radicalverwendet in 'Ideographic Description Sequences'32954 KB
21Other_Default_Ignorable_Code_PointCodepunkte, die von verarbeitenden Programmen bei der Ermittlung der Textgrenzen ignoriert werden dürfen215,8 KB
22DeprecatedVeraltete Zeichen. Diese werden niemals aus dem Standard entfernt, sie sollten jedoch nicht mehr genutzt werden104,1 KB
23Soft_DottedZeichen mit einem 'soft dot' wie i oder j. Ein Accent auf diese Zeichen sollte den Punkt verschwinden lassen156 KB
24Logical_Order_Exceptioneinige wenige Zeichen (Thai, Lao), für die Ausnahmen bei der Ordnung notwendig sind103,8 KB
25Other_ID_StartSonstige Identifier-Startzeichen, also Zeichen, mit welchen Namen beginnen dürfen. Die Gesamtmenge aller Startzeichen umfaßt zu dieser Menge Lu + Ll + Lt + Lm + Lo + Nl, als ID_Continue (folgende Zeichen in Namen) sind Mn + Mc + Nd + Pc erlaubt42,9 KB
26STermSentence Terminal369,4 KB
27Variation_Selectorspezielle Bedeutung195,3 KB

4. Eigenschaften in bezug auf den bidirektionalen Algorithmus (Bidi-Class)

Der bidirektionale Algorithmus legt fest, wie Zeichen verschiedener Schriftrichtung (links-rechts versus rechts-links) verarbeitet werden und wie im Fall von gemischten Texten zu verfahren ist. Dies deckt jene Probleme ab, welche bei Zitaten (Englisch mit eingebettetem Hebräisch u.ä.) auftreten können. Jedem Codepunkt ist genau eine der 19 Eigenschaften zugeordnet. Für die Bidi-Klassen 'L' und 'ON' wurde keine Datei erstellt, da die Ausgaben extrem groß geworden wäre. Die Bidi-Klassen sind ebenfalls in der Blockdarstellung enthalten.
NrBidi-ClassBeschreibungTypAnzahlGröße
1ALRight-to-Left Arabicstrong978170,9 KB
2ANArabic Numberweak124 KB
3BParagraph Separatorneutral73,5 KB
4BNBoundary Neutralweak7113,2 KB
5CSCommon Number Separatorweak134,9 KB
6ENEuropean Numberweak7013,7 KB
7ESEuropean Number Separatorweak32,9 KB
8ETEuropean Number Terminatorweak6113,7 KB
9LLeft-to-Rightstrong7519no file
10LRELeft-to-Right Embeddingstrong12,3 KB
11LROLeft-to-Right Overridestrong12,2 KB
12NSMNon-Spacing Markweak54191,9 KB
13ONOther Neutralsneutral2705no file
14PDFPop Directional Formatweak12,3 KB
15RRight-to-Leftstrong8015,3 KB
16RLERight-to-Left Embeddingstrong12,3 KB
17RLORight-to-Left Overridestrong12,2 KB
18SSegment Separatorneutral32,5 KB
19WSWhitespaceneutral195,8 KB

5. Anmerkungen zu den Einzeldarstellungen

6. Copyright

Falls Sie diese Informationen nützlich finden, können Sie die aktuelle Seite gerne verlinken. Kopieren Sie den untenstehenden Code in Ihren Quelltext oder passen Sie den Linktext Ihren Bedürfnissen an.
<a href='http://www.sql-und-xml.de/unicode-database/'>Unicode-Datenbank</a>

© 2003-2009 Jürgen Auer, Berlin