Warning, /utilities/konsole/tests/text-files/UTF-8-demo.txt is written in an unsupported language. File is not indexed.

0001 
0002 UTF-8 encoded sample plain-text file
0003 ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾
0004 
0005 Markus Kuhn [ˈmaʳkʊs kuːn] <https://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25
0006 
0007 
0008 The ASCII compatible UTF-8 encoding used in this plain-text file
0009 is defined in Unicode, ISO 10646-1, and RFC 2279.
0010 
0011 
0012 Using Unicode/UTF-8, you can write in emails and source code things such as
0013 
0014 Mathematics and sciences:
0015 
0016   ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
0017                                             ⎪⎢⎜│a²+b³ ⎟⎥⎪
0018   ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
0019                                             ⎪⎢⎜⎷ c₈   ⎟⎥⎪
0020   ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
0021                                             ⎪⎢⎜ ∞     ⎟⎥⎪
0022   ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
0023                                             ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪
0024   2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm     ⎩⎣⎝i=1    ⎠⎦⎭
0025 
0026 Linguistics and dictionaries:
0027 
0028   ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn
0029   Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ]
0030 
0031 APL:
0032 
0033   ((V⍳V)=⍳⍴V)/V←,V    ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈
0034 
0035 Nicer typography in plain text files:
0036 
0037   ╔══════════════════════════════════════════╗
0038   ║                                          ║
0039   ║   • ‘single’ and “double” quotes         ║
0040   ║                                          ║
0041   ║   • Curly apostrophes: “We’ve been here” ║
0042   ║                                          ║
0043   ║   • Latin-1 apostrophe and accents: '´`  ║
0044   ║                                          ║
0045   ║   • ‚deutsche‘ „Anführungszeichen“       ║
0046   ║                                          ║
0047   ║   • †, ‡, ‰, •, 3–4, —, −5/+5, ™, …      ║
0048   ║                                          ║
0049   ║   • ASCII safety test: 1lI|, 0OD, 8B     ║
0050   ║                      ╭─────────╮         ║
0051   ║   • the euro symbol: │ 14.95 € │         ║
0052   ║                      ╰─────────╯         ║
0053   ╚══════════════════════════════════════════╝
0054 
0055 Combining characters:
0056 
0057   STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑
0058 
0059 Greek (in Polytonic):
0060 
0061   The Greek anthem:
0062 
0063   Σὲ γνωρίζω ἀπὸ τὴν κόψη
0064   τοῦ σπαθιοῦ τὴν τρομερή,
0065   σὲ γνωρίζω ἀπὸ τὴν ὄψη
0066   ποὺ μὲ βία μετράει τὴ γῆ.
0067 
0068   ᾿Απ᾿ τὰ κόκκαλα βγαλμένη
0069   τῶν ῾Ελλήνων τὰ ἱερά
0070   καὶ σὰν πρῶτα ἀνδρειωμένη
0071   χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά!
0072 
0073   From a speech of Demosthenes in the 4th century BC:
0074 
0075   Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι,
0076   ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς
0077   λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ
0078   τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿
0079   εἰς τοῦτο προήκοντα,  ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ
0080   πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν
0081   οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι,
0082   οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν
0083   ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον
0084   τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι
0085   γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν
0086   προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους
0087   σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ
0088   τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ
0089   τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς
0090   τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον.
0091 
0092   Δημοσθένους, Γ´ ᾿Ολυνθιακὸς
0093 
0094 Georgian:
0095 
0096   From a Unicode conference invitation:
0097 
0098   გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო
0099   კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს,
0100   ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს
0101   ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი,
0102   ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება
0103   ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში,
0104   ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში.
0105 
0106 Russian:
0107 
0108   From a Unicode conference invitation:
0109 
0110   Зарегистрируйтесь сейчас на Десятую Международную Конференцию по
0111   Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии.
0112   Конференция соберет широкий круг экспертов по  вопросам глобального
0113   Интернета и Unicode, локализации и интернационализации, воплощению и
0114   применению Unicode в различных операционных системах и программных
0115   приложениях, шрифтах, верстке и многоязычных компьютерных системах.
0116 
0117 Thai (UCS Level 2):
0118 
0119   Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese
0120   classic 'San Gua'):
0121 
0122   [----------------------------|------------------------]
0123     ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช  พระปกเกศกองบู๊กู้ขึ้นใหม่
0124   สิบสองกษัตริย์ก่อนหน้าแลถัดไป       สององค์ไซร้โง่เขลาเบาปัญญา
0125     ทรงนับถือขันทีเป็นที่พึ่ง           บ้านเมืองจึงวิปริตเป็นนักหนา
0126   โฮจิ๋นเรียกทัพทั่วหัวเมืองมา         หมายจะฆ่ามดชั่วตัวสำคัญ
0127     เหมือนขับไสไล่เสือจากเคหา      รับหมาป่าเข้ามาเลยอาสัญ
0128   ฝ่ายอ้องอุ้นยุแยกให้แตกกัน          ใช้สาวนั้นเป็นชนวนชื่นชวนใจ
0129     พลันลิฉุยกุยกีกลับก่อเหตุ          ช่างอาเพศจริงหนาฟ้าร้องไห้
0130   ต้องรบราฆ่าฟันจนบรรลัย           ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ
0131 
0132   (The above is a two-column text. If combining characters are handled
0133   correctly, the lines of the second column should be aligned with the
0134   | character above.)
0135 
0136 Ethiopian:
0137 
0138   Proverbs in the Amharic language:
0139 
0140   ሰማይ አይታረስ ንጉሥ አይከሰስ።
0141   ብላ ካለኝ እንደአባቴ በቆመጠኝ።
0142   ጌጥ ያለቤቱ ቁምጥና ነው።
0143   ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው።
0144   የአፍ ወለምታ በቅቤ አይታሽም።
0145   አይጥ በበላ ዳዋ ተመታ።
0146   ሲተረጉሙ ይደረግሙ።
0147   ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል።
0148   ድር ቢያብር አንበሳ ያስር።
0149   ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም።
0150   እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም።
0151   የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ።
0152   ሥራ ከመፍታት ልጄን ላፋታት።
0153   ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል።
0154   የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ።
0155   ተንጋሎ ቢተፉ ተመልሶ ባፉ።
0156   ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው።
0157   እግርህን በፍራሽህ ልክ ዘርጋ።
0158 
0159 Runes:
0160 
0161   ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ
0162 
0163   (Old English, which transcribed into Latin reads 'He cwaeth that he
0164   bude thaem lande northweardum with tha Westsae.' and means 'He said
0165   that he lived in the northern land near the Western Sea.')
0166 
0167 Braille:
0168 
0169   ⡌⠁⠧⠑ ⠼⠁⠒  ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌
0170 
0171   ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞
0172   ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎
0173   ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂
0174   ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙
0175   ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑
0176   ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲
0177 
0178   ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
0179 
0180   ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹
0181   ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞
0182   ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕
0183   ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹
0184   ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎
0185   ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎
0186   ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳
0187   ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞
0188   ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲
0189 
0190   (The first couple of paragraphs of "A Christmas Carol" by Dickens)
0191 
0192 Compact font selection example text:
0193 
0194   ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789
0195   abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ
0196   –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд
0197   ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi�⑀₂ἠḂӥẄɐː⍎אԱა
0198 
0199 Greetings in various languages:
0200 
0201   Hello world, Καλημέρα κόσμε, コンニチハ
0202 
0203 Box drawing alignment tests:                                          █
02040205   ╔══╦══╗  ┌──┬──┐  ╭──┬──╮  ╭──┬──╮  ┏━━┳━━┓  ┎┒┏┑   ╷  ╻ ┏┯┓ ┌┰┐    ▊ ╱╲╱╲╳╳╳
0206   ║┌─╨─┐║  │╔═╧═╗│  │╒═╪═╕│  │╓─╁─╖│  ┃┌─╂─┐┃  ┗╃╄┙  ╶┼╴╺╋╸┠┼┨ ┝╋┥    ▋ ╲╱╲╱╳╳╳
0207   ║│╲ ╱│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╿ │┃  ┍╅╆┓   ╵  ╹ ┗┷┛ └┸┘    ▌ ╱╲╱╲╳╳╳
0208   ╠╡ ╳ ╞╣  ├╢   ╟┤  ├┼─┼─┼┤  ├╫─╂─╫┤  ┣┿╾┼╼┿┫  ┕┛┖┚     ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳
0209   ║│╱ ╲│║  │║   ║│  ││ │ ││  │║ ┃ ║│  ┃│ ╽ │┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▎
0210   ║└─╥─┘║  │╚═╤═╝│  │╘═╪═╛│  │╙─╀─╜│  ┃└─╂─┘┃  ░░▒▒▓▓██ ┊  ┆ ╎ ╏  ┇ ┋ ▏
0211   ╚══╩══╝  └──┴──┘  ╰──┴──╯  ╰──┴──╯  ┗━━┻━━┛  ▗▄▖▛▀▜   └╌╌┘ ╎ ┗╍╍┛ ┋  ▁▂▃▄▅▆▇█
0212                                                ▝▀▘▙▄▟