Warning, /utilities/konsole/tests/text-files/UTF-8-demo.txt is written in an unsupported language. File is not indexed.
0001 0002 UTF-8 encoded sample plain-text file 0003 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾ 0004 0005 Markus Kuhn [ˈmaʳkʊs kuːn] <https://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25 0006 0007 0008 The ASCII compatible UTF-8 encoding used in this plain-text file 0009 is defined in Unicode, ISO 10646-1, and RFC 2279. 0010 0011 0012 Using Unicode/UTF-8, you can write in emails and source code things such as 0013 0014 Mathematics and sciences: 0015 0016 ∮ E⋅da = Q, n → ∞, ∑ f(i) = ∏ g(i), ⎧⎡⎛┌─────┐⎞⎤⎫ 0017 ⎪⎢⎜│a²+b³ ⎟⎥⎪ 0018 ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β), ⎪⎢⎜│───── ⎟⎥⎪ 0019 ⎪⎢⎜⎷ c₈ ⎟⎥⎪ 0020 ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ, ⎨⎢⎜ ⎟⎥⎬ 0021 ⎪⎢⎜ ∞ ⎟⎥⎪ 0022 ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫), ⎪⎢⎜ ⎲ ⎟⎥⎪ 0023 ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪ 0024 2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm ⎩⎣⎝i=1 ⎠⎦⎭ 0025 0026 Linguistics and dictionaries: 0027 0028 ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn 0029 Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ] 0030 0031 APL: 0032 0033 ((V⍳V)=⍳⍴V)/V←,V ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈ 0034 0035 Nicer typography in plain text files: 0036 0037 ╔══════════════════════════════════════════╗ 0038 ║ ║ 0039 ║ • ‘single’ and “double” quotes ║ 0040 ║ ║ 0041 ║ • Curly apostrophes: “We’ve been here” ║ 0042 ║ ║ 0043 ║ • Latin-1 apostrophe and accents: '´` ║ 0044 ║ ║ 0045 ║ • ‚deutsche‘ „Anführungszeichen“ ║ 0046 ║ ║ 0047 ║ • †, ‡, ‰, •, 3–4, —, −5/+5, ™, … ║ 0048 ║ ║ 0049 ║ • ASCII safety test: 1lI|, 0OD, 8B ║ 0050 ║ ╭─────────╮ ║ 0051 ║ • the euro symbol: │ 14.95 € │ ║ 0052 ║ ╰─────────╯ ║ 0053 ╚══════════════════════════════════════════╝ 0054 0055 Combining characters: 0056 0057 STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑ 0058 0059 Greek (in Polytonic): 0060 0061 The Greek anthem: 0062 0063 Σὲ γνωρίζω ἀπὸ τὴν κόψη 0064 τοῦ σπαθιοῦ τὴν τρομερή, 0065 σὲ γνωρίζω ἀπὸ τὴν ὄψη 0066 ποὺ μὲ βία μετράει τὴ γῆ. 0067 0068 ᾿Απ᾿ τὰ κόκκαλα βγαλμένη 0069 τῶν ῾Ελλήνων τὰ ἱερά 0070 καὶ σὰν πρῶτα ἀνδρειωμένη 0071 χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά! 0072 0073 From a speech of Demosthenes in the 4th century BC: 0074 0075 Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι, 0076 ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς 0077 λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ 0078 τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿ 0079 εἰς τοῦτο προήκοντα, ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ 0080 πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν 0081 οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι, 0082 οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν 0083 ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον 0084 τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι 0085 γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν 0086 προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους 0087 σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ 0088 τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ 0089 τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς 0090 τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον. 0091 0092 Δημοσθένους, Γ´ ᾿Ολυνθιακὸς 0093 0094 Georgian: 0095 0096 From a Unicode conference invitation: 0097 0098 გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო 0099 კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს, 0100 ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს 0101 ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი, 0102 ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება 0103 ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში, 0104 ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში. 0105 0106 Russian: 0107 0108 From a Unicode conference invitation: 0109 0110 Зарегистрируйтесь сейчас на Десятую Международную Конференцию по 0111 Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии. 0112 Конференция соберет широкий круг экспертов по вопросам глобального 0113 Интернета и Unicode, локализации и интернационализации, воплощению и 0114 применению Unicode в различных операционных системах и программных 0115 приложениях, шрифтах, верстке и многоязычных компьютерных системах. 0116 0117 Thai (UCS Level 2): 0118 0119 Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese 0120 classic 'San Gua'): 0121 0122 [----------------------------|------------------------] 0123 ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช พระปกเกศกองบู๊กู้ขึ้นใหม่ 0124 สิบสองกษัตริย์ก่อนหน้าแลถัดไป สององค์ไซร้โง่เขลาเบาปัญญา 0125 ทรงนับถือขันทีเป็นที่พึ่ง บ้านเมืองจึงวิปริตเป็นนักหนา 0126 โฮจิ๋นเรียกทัพทั่วหัวเมืองมา หมายจะฆ่ามดชั่วตัวสำคัญ 0127 เหมือนขับไสไล่เสือจากเคหา รับหมาป่าเข้ามาเลยอาสัญ 0128 ฝ่ายอ้องอุ้นยุแยกให้แตกกัน ใช้สาวนั้นเป็นชนวนชื่นชวนใจ 0129 พลันลิฉุยกุยกีกลับก่อเหตุ ช่างอาเพศจริงหนาฟ้าร้องไห้ 0130 ต้องรบราฆ่าฟันจนบรรลัย ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ 0131 0132 (The above is a two-column text. If combining characters are handled 0133 correctly, the lines of the second column should be aligned with the 0134 | character above.) 0135 0136 Ethiopian: 0137 0138 Proverbs in the Amharic language: 0139 0140 ሰማይ አይታረስ ንጉሥ አይከሰስ። 0141 ብላ ካለኝ እንደአባቴ በቆመጠኝ። 0142 ጌጥ ያለቤቱ ቁምጥና ነው። 0143 ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው። 0144 የአፍ ወለምታ በቅቤ አይታሽም። 0145 አይጥ በበላ ዳዋ ተመታ። 0146 ሲተረጉሙ ይደረግሙ። 0147 ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል። 0148 ድር ቢያብር አንበሳ ያስር። 0149 ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም። 0150 እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም። 0151 የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ። 0152 ሥራ ከመፍታት ልጄን ላፋታት። 0153 ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል። 0154 የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ። 0155 ተንጋሎ ቢተፉ ተመልሶ ባፉ። 0156 ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው። 0157 እግርህን በፍራሽህ ልክ ዘርጋ። 0158 0159 Runes: 0160 0161 ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ 0162 0163 (Old English, which transcribed into Latin reads 'He cwaeth that he 0164 bude thaem lande northweardum with tha Westsae.' and means 'He said 0165 that he lived in the northern land near the Western Sea.') 0166 0167 Braille: 0168 0169 ⡌⠁⠧⠑ ⠼⠁⠒ ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌ 0170 0171 ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞ 0172 ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎ 0173 ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂ 0174 ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙ 0175 ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑ 0176 ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲ 0177 0178 ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ 0179 0180 ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹ 0181 ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞ 0182 ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕ 0183 ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹ 0184 ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎ 0185 ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎ 0186 ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳ 0187 ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞ 0188 ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ 0189 0190 (The first couple of paragraphs of "A Christmas Carol" by Dickens) 0191 0192 Compact font selection example text: 0193 0194 ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789 0195 abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ 0196 –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд 0197 ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა 0198 0199 Greetings in various languages: 0200 0201 Hello world, Καλημέρα κόσμε, コンニチハ 0202 0203 Box drawing alignment tests: █ 0204 ▉ 0205 ╔══╦══╗ ┌──┬──┐ ╭──┬──╮ ╭──┬──╮ ┏━━┳━━┓ ┎┒┏┑ ╷ ╻ ┏┯┓ ┌┰┐ ▊ ╱╲╱╲╳╳╳ 0206 ║┌─╨─┐║ │╔═╧═╗│ │╒═╪═╕│ │╓─╁─╖│ ┃┌─╂─┐┃ ┗╃╄┙ ╶┼╴╺╋╸┠┼┨ ┝╋┥ ▋ ╲╱╲╱╳╳╳ 0207 ║│╲ ╱│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╿ │┃ ┍╅╆┓ ╵ ╹ ┗┷┛ └┸┘ ▌ ╱╲╱╲╳╳╳ 0208 ╠╡ ╳ ╞╣ ├╢ ╟┤ ├┼─┼─┼┤ ├╫─╂─╫┤ ┣┿╾┼╼┿┫ ┕┛┖┚ ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳ 0209 ║│╱ ╲│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╽ │┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▎ 0210 ║└─╥─┘║ │╚═╤═╝│ │╘═╪═╛│ │╙─╀─╜│ ┃└─╂─┘┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▏ 0211 ╚══╩══╝ └──┴──┘ ╰──┴──╯ ╰──┴──╯ ┗━━┻━━┛ ▗▄▖▛▀▜ └╌╌┘ ╎ ┗╍╍┛ ┋ ▁▂▃▄▅▆▇█ 0212 ▝▀▘▙▄▟