Module talk:Unicode data/testcases

1 of 108 tests failed.

testcases for get_best_script
Text Expected Actual
checkY %!?́: Zyyy (3), Zinh (1) nil nil
checkY ’ʼ“”†‡•‰′‽⁕
• Zyyy (11)
nil nil
checkY col·legi: Latn (7), Zyyy (1) Latn Latn
HTML character references
checkY 𐘀: Lina (1) Lina Lina
checkY 𐘀
• Zyyy (8), Latn (1)
Lina Lina
checkY
• Zyyy (1)
nil nil
checkY
• Latn (5), Zyyy (2)
nil nil
Halkomelem
checkY lá:yelhp: Latn (7), Zyyy (1) Latn Latn
checkY xʷməθkʷəy̓əm: Latn (10), Grek (1), Zinh (1) nil nil
checkY hən̓q̓əmin̓əm̓: Latn (10), Zinh (4) Latn Latn
Quotes
checkY Tant’è amara che poco è più morte;
ma per trattar del ben ch’i’ vi trovai,
dirò de l’altre cose ch’i’ v’ ho scorte.
• Latn (83), Zyyy (32)
Latn Latn
checkY Díí Késhmish biyiʼ yáʼąąshdę́ę́ʼ ląʼígóó bee nikʼihojidlíi dooleeł.
Niheechʼínáánáháhígíí biyiʼ iłhodeezyéél, iłhózhǫ́, ayóóʼóʼóʼní
bee nikʼihojidlíi dooleeł. Tʼáá sahdiigiʼ átʼéego baa hózhǫ́ǫgo
nihił hanááhoolzhiizhígí biyiʼ tʼáá ałtsojįʼ iłhózhǫ́ nííʼ dooleeł.
• Latn (207), Zyyy (52), Zinh (5)
Latn Latn
checkY Μῆνῐν ᾰ̓́ειδε, θεᾱ́, Πηληῐ̈ᾰ́δεω Ᾰ̓χῐλῆος
οὐλομένην, ἣ μῡρῐ́᾽ Ᾰ̓χαιοῖς ᾰ̓́λγε᾽ ἔθηκε,
πολλᾱ̀ς δ᾽ ῐ̓φθῑ́μους ψῡχᾱ̀ς Ἄῐ̈δῐ προῐ̈́ᾰψεν
ἡρώων, αὐτοὺς δὲ ἑλώρῐᾰ τεῦχε κῠ́νεσσιν
οἰωνοῖσῐ́ τε πᾶσῐ· Δῐὸς δ᾽ ἐτελείετο βουλή·
• Grek (160), Zyyy (36), Zinh (19)
Grek Grek
checkY Вот если вы не согласитесь с этим последним тезисом и
ответите: «Не так» или «не всегда так», то я, пожалуй, и
ободрюсь духом насчет значения героя моего Алексея
Федоровича. Ибо не только чудак «не всегда» частность и
обособление, а напротив, бывает так, что он-то, пожалуй,
и носит в себе иной раз сердцевину целого, а остальные
люди его эпохи — все, каким-нибудь наплывным ветром,
на время почему-то от него оторвались…
• Cyrl (329), Zyyy (93)
Cyrl Cyrl
checkY ॐ अग्निमीळे पुरोहितं यज्ञस्य देवमृत्विजम् ।
होतारं रत्नधातमम् ॥१॥
अग्निः पूर्वेभिरृषिभिरीड्यो नूतनैरुत ।
स देवाँ एह वक्षति ॥२॥
अग्निना रयिमश्नवत् पोषमेव दिवेदिवे ।
यशसं वीरवत्तमम् ॥३॥
अग्ने यं यज्ञमध्वरं विश्वतः परिभूरसि ।
स इद्देवेषु गच्छति ॥४॥
अग्निर्होता कविक्रतुः सत्यश्चित्रश्रवस्तमः ।
देवो देवेभिरा गमत् ॥५॥
यदङ्ग दाशुषे त्वमग्ने भद्रं करिष्यसि ।
तवेत् तत् सत्यमङ्गिरः ॥६॥
उप त्वाग्ने दिवेदिवे दोषावस्तर्धिया वयम् ।
नमो भरन्त एमसि ॥७॥
राजन्तमध्वराणां गोपामृतस्य दीदिविम् ।
वर्धमानं स्वे दमे ॥८॥
स नः पितेव सूनवेऽग्ने सूपायनो भव ।
सचस्वा नः स्वस्तये ॥९॥
• Deva (449), Zyyy (109)
Deva Deva
testcases for is_Latin
Text Expected Actual
checkY %!?́: Zyyy (3), Zinh (1) false false
checkY ’ʼ“”†‡•‰′‽⁕
• Zyyy (11)
false false
checkY col·legi: Latn (7), Zyyy (1) true true
HTML character references
checkY 𐘀: Lina (1) false false
checkY 𐘀
• Zyyy (8), Latn (1)
false false
checkY
• Zyyy (1)
false false
checkY
• Latn (5), Zyyy (2)
false false
Halkomelem
checkY lá:yelhp: Latn (7), Zyyy (1) true true
checkY xʷməθkʷəy̓əm: Latn (10), Grek (1), Zinh (1) false false
checkY hən̓q̓əmin̓əm̓: Latn (10), Zinh (4) true true
Quotes
checkY Tant’è amara che poco è più morte;
ma per trattar del ben ch’i’ vi trovai,
dirò de l’altre cose ch’i’ v’ ho scorte.
• Latn (83), Zyyy (32)
true true
checkY Díí Késhmish biyiʼ yáʼąąshdę́ę́ʼ ląʼígóó bee nikʼihojidlíi dooleeł.
Niheechʼínáánáháhígíí biyiʼ iłhodeezyéél, iłhózhǫ́, ayóóʼóʼóʼní
bee nikʼihojidlíi dooleeł. Tʼáá sahdiigiʼ átʼéego baa hózhǫ́ǫgo
nihił hanááhoolzhiizhígí biyiʼ tʼáá ałtsojįʼ iłhózhǫ́ nííʼ dooleeł.
• Latn (207), Zyyy (52), Zinh (5)
true true
checkY Μῆνῐν ᾰ̓́ειδε, θεᾱ́, Πηληῐ̈ᾰ́δεω Ᾰ̓χῐλῆος
οὐλομένην, ἣ μῡρῐ́᾽ Ᾰ̓χαιοῖς ᾰ̓́λγε᾽ ἔθηκε,
πολλᾱ̀ς δ᾽ ῐ̓φθῑ́μους ψῡχᾱ̀ς Ἄῐ̈δῐ προῐ̈́ᾰψεν
ἡρώων, αὐτοὺς δὲ ἑλώρῐᾰ τεῦχε κῠ́νεσσιν
οἰωνοῖσῐ́ τε πᾶσῐ· Δῐὸς δ᾽ ἐτελείετο βουλή·
• Grek (160), Zyyy (36), Zinh (19)
false false
checkY Вот если вы не согласитесь с этим последним тезисом и
ответите: «Не так» или «не всегда так», то я, пожалуй, и
ободрюсь духом насчет значения героя моего Алексея
Федоровича. Ибо не только чудак «не всегда» частность и
обособление, а напротив, бывает так, что он-то, пожалуй,
и носит в себе иной раз сердцевину целого, а остальные
люди его эпохи — все, каким-нибудь наплывным ветром,
на время почему-то от него оторвались…
• Cyrl (329), Zyyy (93)
false false
checkY ॐ अग्निमीळे पुरोहितं यज्ञस्य देवमृत्विजम् ।
होतारं रत्नधातमम् ॥१॥
अग्निः पूर्वेभिरृषिभिरीड्यो नूतनैरुत ।
स देवाँ एह वक्षति ॥२॥
अग्निना रयिमश्नवत् पोषमेव दिवेदिवे ।
यशसं वीरवत्तमम् ॥३॥
अग्ने यं यज्ञमध्वरं विश्वतः परिभूरसि ।
स इद्देवेषु गच्छति ॥४॥
अग्निर्होता कविक्रतुः सत्यश्चित्रश्रवस्तमः ।
देवो देवेभिरा गमत् ॥५॥
यदङ्ग दाशुषे त्वमग्ने भद्रं करिष्यसि ।
तवेत् तत् सत्यमङ्गिरः ॥६॥
उप त्वाग्ने दिवेदिवे दोषावस्तर्धिया वयम् ।
नमो भरन्त एमसि ॥७॥
राजन्तमध्वराणां गोपामृतस्य दीदिविम् ।
वर्धमानं स्वे दमे ॥८॥
स नः पितेव सूनवेऽग्ने सूपायनो भव ।
सचस्वा नः स्वस्तये ॥९॥
• Deva (449), Zyyy (109)
false false
testcases for is_combining
Text Expected Actual
checkY U+0300: ◌̀ (COMBINING GRAVE ACCENT) true true
checkY U+0060: ` (GRAVE ACCENT) false false
testcases for is_default_ignorable
Text Expected Actual
testcases for is_rtl
Text Expected Actual
checkY أبو عبد الله محمد بن عبد الله اللواتي الطنجي بن بطوطة true true
checkY أدب القاضي Adab al-qādī false false
checkY ܛܘܼܒܲܝܗܘܿܢ ܠܐܲܝܠܹܝܢ ܕܲܕ݂ܟܹܝܢ ܒܠܸܒ̇ܗܘܿܢ܄ ܕܗܸܢ݂ܘܿܢ ܢܸܚܙܘܿܢ ܠܐܲܠܵܗܵܐ܂‬ true true
checkY בְּרֵאשִׁית, בָּרָא אֱלֹהִים, אֵת הַשָּׁמַיִם, וְאֵת הָאָרֶץ. true true
checkY 𞤀𞤣𞤤𞤢𞤥 𞤆𞤵𞤤𞤢𞤪 true true
checkY 𐬬𐬍𐬯𐬞𐬈 ⸱ 𐬰𐬍 ⸱ 𐬀𐬥𐬌𐬌𐬉 ⸱ 𐬨𐬀𐬜𐬃𐬢𐬵𐬋 ⸱ 𐬀𐬉𐬴𐬨𐬀 ⸱ 𐬵𐬀𐬗𐬌𐬧𐬙𐬈 ⸱ 𐬑𐬭𐬎𐬎𐬍𐬨 ⸱ 𐬛𐬭𐬎𐬎𐬋 ⸱ 𐬁𐬀𐬝 ⸱ 𐬵𐬋 ⸱ 𐬫𐬋 ⸱ 𐬵𐬀𐬊𐬨𐬀𐬵𐬈 ⸱ 𐬨𐬀𐬜𐬋 ⸱ 𐬀𐬴𐬀 ⸱ 𐬵𐬀𐬗𐬀𐬌𐬙𐬈 true true
checkY ދިވެހި true true
checkY 𐤀𐤓𐤍𐤟𐤆𐤐𐤏𐤋𐤟𐤀𐤕𐤁𐤏𐤋𐤟𐤁𐤍𐤀𐤇𐤓𐤌𐤟𐤌𐤋𐤊𐤂𐤁𐤋𐤟𐤋𐤀𐤇𐤓𐤌𐤟𐤀𐤁𐤄 true true
checkY ࡌࡀࡍࡃࡀ ࡖࡄࡉࡉࡀ true true
checkY ࠄࠟࠓࠂࠝࠓࠜࠉࠆࠜࠉࠌ true true
checkY %$!^& false false
testcases for lookup_age
Text Expected Actual
testcases for lookup_block
Text Expected Actual
checkY U+0064: d Basic Latin Basic Latin
checkY U+030B: ◌̋ Combining Diacritical Marks Combining Diacritical Marks
checkY U+03A3: Σ Greek and Coptic Greek and Coptic
checkY U+0411: Б Cyrillic Cyrillic
checkY U+10E6: ღ Georgian Georgian
checkY U+3175: ㅵ Hangul Compatibility Jamo Hangul Compatibility Jamo
checkY U+AC01: 각 Hangul Syllables Hangul Syllables
checkY U+4E0A: 上 CJK Unified Ideographs CJK Unified Ideographs
checkY U+1F608: 😈 Emoticons Emoticons
checkY U+30000: 𰀀 CJK Unified Ideographs Extension G CJK Unified Ideographs Extension G
checkY U+10FFFF Supplementary Private Use Area-B Supplementary Private Use Area-B
testcases for lookup_category
Text Expected Actual
checkY U+0009 (<control-0009>) Cc Cc
checkY U+0020: (SPACE) Zs Zs
checkY U+005B: [ (LEFT SQUARE BRACKET) Ps Ps
checkY U+005D: ] (RIGHT SQUARE BRACKET) Pe Pe
checkY U+005E: ^ (CIRCUMFLEX ACCENT) Sk Sk
checkY U+0041: A (LATIN CAPITAL LETTER A) Lu Lu
checkY U+00AD (SOFT HYPHEN) Cf Cf
checkY U+00BE: ¾ (VULGAR FRACTION THREE QUARTERS) No No
checkY U+00AB: « (LEFT-POINTING DOUBLE ANGLE QUOTATION MARK) Pi Pi
checkY U+00BB: » (RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK) Pf Pf
checkY U+0300: ◌̀ (COMBINING GRAVE ACCENT) Mn Mn
checkY U+0488: ҈ (COMBINING CYRILLIC HUNDRED THOUSANDS SIGN) Me Me
checkY U+0663: ٣ (ARABIC-INDIC DIGIT THREE) Nd Nd
checkY U+5B50: 子 (CJK UNIFIED IDEOGRAPH-5B50) Lo Lo
checkY U+1FAE: ᾮ (GREEK CAPITAL LETTER OMEGA WITH PSILI AND PERISPOMENI AND PROSGEGRAMMENI) Lt Lt
checkY U+1B44: ◌᭄ (BALINESE ADEG ADEG) Mc Mc
checkY U+2208: ∈ (ELEMENT OF) Sm Sm
checkY U+203F: ‿ (UNDERTIE) Pc Pc
checkY U+21B9: ↹ (LEFTWARDS ARROW TO BAR OVER RIGHTWARDS ARROW TO BAR) So So
checkY U+2E17: ⸗ (DOUBLE OBLIQUE HYPHEN) Pd Pd
checkY U+2167: Ⅷ (ROMAN NUMERAL EIGHT) Nl Nl
checkY U+2028 (LINE SEPARATOR) Zl Zl
checkY U+2029 (PARAGRAPH SEPARATOR) Zp Zp
checkY U+309E: ゞ (HIRAGANA VOICED ITERATION MARK) Lm Lm
checkY U+D800 (<surrogate-D800>) Cs Cs
checkY U+FFE1: £ (FULLWIDTH POUND SIGN) Sc Sc
☒N U+FFFF (<noncharacter-FFFF>) Cn nil
checkY U+100000 (<private-use-100000>) Co Co
testcases for lookup_name
Text Expected Actual
checkY U+0000 <control-0000> <control-0000>
checkY U+007F <control-007F> <control-007F>
checkY U+00C1: Á LATIN CAPITAL LETTER A WITH ACUTE LATIN CAPITAL LETTER A WITH ACUTE
checkY U+0300: ◌̀ COMBINING GRAVE ACCENT COMBINING GRAVE ACCENT
checkY U+0378 <reserved-0378> <reserved-0378>
checkY U+1B44: ◌᭄ BALINESE ADEG ADEG BALINESE ADEG ADEG
checkY U+1F71: ά GREEK SMALL LETTER ALPHA WITH OXIA GREEK SMALL LETTER ALPHA WITH OXIA
checkY U+3555: 㕕 CJK UNIFIED IDEOGRAPH-3555 CJK UNIFIED IDEOGRAPH-3555
checkY U+AC01: 각 HANGUL SYLLABLE GAG HANGUL SYLLABLE GAG
checkY U+D5FF: 헿 HANGUL SYLLABLE HEH HANGUL SYLLABLE HEH
checkY U+DC00 <surrogate-DC00> <surrogate-DC00>
checkY U+EEEE <private-use-EEEE> <private-use-EEEE>
checkY U+FDD1 <noncharacter-FDD1> <noncharacter-FDD1>
checkY U+FFFD: � REPLACEMENT CHARACTER REPLACEMENT CHARACTER
checkY U+FFFF <noncharacter-FFFF> <noncharacter-FFFF>
checkY U+1F4A9: 💩 PILE OF POO PILE OF POO
checkY U+E0000 <reserved-E0000> <reserved-E0000>
checkY U+F0F0F <private-use-F0F0F> <private-use-F0F0F>
checkY U+10FFFF <noncharacter-10FFFF> <noncharacter-10FFFF>
testcases for lookup_script
Text Expected Actual
checkY U+0061: a (LATIN SMALL LETTER A) Latn Latn
checkY U+002F: / (SOLIDUS) Zyyy Zyyy
checkY U+0300: ◌̀ (COMBINING GRAVE ACCENT) Zinh Zinh
checkY U+0378 (<reserved-0378>) Zzzz Zzzz
checkY U+0398: Θ (GREEK CAPITAL LETTER THETA) Grek Grek
checkY U+03E2: Ϣ (COPTIC CAPITAL LETTER SHEI) Copt Copt
checkY U+2014: — (EM DASH) Zyyy Zyyy