International content
After conversations with various theme developers who work with other languages than English, it occurred to me the Theme Unit Test Data could benefit greatly from having proper international content. This would allow testing of things like long words (Finnish, Icelandic, Inuktitut, etc), non-english letters in their natural context (eg æ, ø, å, germanic ß, various accents, etc), RTL languages, and the likes.
Right now, the only way to test a theme for support of non-english letters is through the character map, but this doesn't provide a good testing scenario. Likewise, RTL testing can be done using a plugin, but it'll be applied to English content, not actual RTL languages.
Having a couple of posts in representative languages - Finnish, German, French, Spanish, Simplified Chinese, Farsi, Hebrew, etc - would make it easier for theme developers to test their themes not only against English, but other real language examples.
Lorem Ipsum-ը տպագրության և տպագրական արդյունաբերության համար նախատեսված մոդելային տեքստ է: Սկսած 1500-ականներիցLorem Ipsum-ը հանդիսացել է տպագրական արդյունաբերության ստանդարտ մոդելային տեքստ, ինչը մի անհայտ տպագրիչի կողմից տարբեր տառատեսակների օրինակների գիրք ստեղծելու ջանքերի արդյունք է: Այս տեքստը ոչ միայն կարողացել է գոյատևել հինգ դարաշրջան, այլև ներառվել է էլեկտրոնային տպագրության մեջ
մնալով էապես անփոփոխ: Այն հայտնի է դարձել 1960-ականներին Lorem Ipsum բովանդակող Letraset էջերի թողարկման արդյունքում, իսկ ավելի ուշ համակարգչային տպագրության այնպիսի ծրագրերի թողարկման հետևանքով, ինչպիսին է Aldus PageMaker-ը, որը ներառում է Lorem Ipsum-ի տարատեսակներ:
Lorem Ipsum е елементарен примерен текст, използван в печатарската и типографската индустрия. Lorem Ipsum е индустриален стандарт от около 1500 година, когато неизвестен печатар взема няколко печатарски букви и ги разбърква, за да напечата с тях книга с примерни шрифтове. Този начин не само е оцелял повече от 5 века, но е навлязъл и в публикуването на електронни издания като е запазен почти без промяна. Популяризиран е през 60те години на 20ти век със издаването на Letraset листи, съдържащи Lorem Ipsum пасажи, популярен е и в наши дни във софтуер за печатни издания като Aldus PageMaker, който включва различни версии на Lorem Ipsum.
Lorem Ipsum és un text de farciment usat per la indústria de la tipografia i la impremta. Lorem Ipsum ha estat el text estàndard de la indústria des de l’any 1500, quan un impressor desconegut va fer servir una galerada de text i la va mesclar per crear un llibre de mostres tipogràfiques. No només ha sobreviscut cinc segles, sinó que ha fet el salt cap a la creació de tipus de lletra electrònics, romanent essencialment sense canvis. Es va popularitzar l’any 1960 amb el llançament de fulls Letraset que contenien passatges de Lorem Ipsum, i més recentment amb programari d’autoedició com Aldus Pagemaker que inclou versions de Lorem Ipsum.
Lorem Ipsum je jednostavno probni tekst koji se koristi u tiskarskoj i slovoslagarskoj industriji. Lorem Ipsum postoji kao industrijski standard još od 16-og stoljeća, kada je nepoznati tiskar uzeo tiskarsku galiju slova i posložio ih da bi napravio knjigu s uzorkom tiska. Taj je tekst ne samo preživio pet stoljeća, već se i vinuo u svijet elektronskog slovoslagarstva, ostajući u suštini nepromijenjen. Postao je popularan tijekom 1960-ih s pojavom Letraset listova s odlomcima Lorem Ipsum-a, a u skorije vrijeme sa software-om za stolno izdavaštvo kao što je Aldus PageMaker koji također sadrži varijante Lorem Ipsum-a.
Lorem Ipsum je demonstrativní výplňový text používaný v tiskařském a knihařském průmyslu. Lorem Ipsum je považováno za standard v této oblasti už od začátku 16. století, kdy dnes neznámý tiskař vzal kusy textu a na jejich základě vytvořil speciální vzorovou knihu. Jeho odkaz nevydržel pouze pět století, on přežil i nástup elektronické sazby v podstatě beze změny. Nejvíce popularizováno bylo Lorem Ipsum v šedesátých letech 20. století, kdy byly vydávány speciální vzorníky s jeho pasážemi a později pak díky počítačovým DTP programům jako Aldus PageMaker.
Lorem Ipsum este pur şi simplu o machetă pentru text a industriei tipografice. Lorem Ipsum a fost macheta standard a industriei încă din secolul al XVI-lea, când un tipograf anonim a luat o planşetă de litere şi le-a amestecat pentru a crea o carte demonstrativă pentru literele respective. Nu doar că a supravieţuit timp de cinci secole, dar şi a facut saltul în tipografia electronică practic neschimbată. A fost popularizată în anii ’60 odată cu ieşirea colilor Letraset care conţineau pasaje Lorem Ipsum, iar mai recent, prin programele de publicare pentru calculator, ca Aldus PageMaker care includeau versiuni de Lorem Ipsum.
Lorem Ipsum је једноставно модел текста који се користи у штампарској и словослагачкој индустрији. Lorem ipsum је био стандард за модел текста још од 1500. године, када је непознати штампар узео кутију са словима и сложио их како би направио узорак књиге. Не само што је овај модел опстао пет векова, него је чак почео да се користи и у електронским медијима, непроменивши се. Популаризован је шездесетих година двадесетог века заједно са листовима летерсета који су садржали Lorem Ipsum пасусе, а данас са софтверским пакетом за прелом као што је Aldus PageMaker који је садржао Lorem Ipsum верзије.`
Those are mostly slavic languages. No Scandinavian, no asian, no central European. There's a lot of stuff missing.
Ideally the unit test would have separate posts for each language with representative titles etc. Rather than having a post with a made up "extralongtitlejusttoseewhatthatwouldlooklike", you could use an actual Finnish or Welsh title that contains real words that are absurdly long.
By breaking them into individual posts, people can test their themes against specific scenarios and languages. It's possible this would work better as a separate "International" Theme Unit Test.
Also, while Lorem Ipsum is easy, it is a poor substitute for modern languages.
Only reason I'm mentioning scandinavian languages is we have 29 character alphabets and long component words. Icelandic has even more letters, and Finnish has outlandishly long words.
Oh totally agree! I can help with Finnish. I'll get back to this when I'm back on my computer.
One post per language? How much do we write?
I can write post in Finnish with real words.
- Title should have long word, and probably using scandinavian letters. We use ä, ö, and å.
- Content should have also long words, and scandinavian letters.
Something else I'm missing?
I can try working with Chinese (Simplified and Traditional)
@carolinan: Do you have very long words as we do in Finnish? But yeah, we probably don't need both if I include ä, ö, and å.
@emiluzelac: I don't think post in Finnish should be translated from English. Because point of post should be that it's something unique to this language. And using words that would likely never be used in English.
Or did I just misunderstood you?
For example if in English you have long word, in Finnish it could be really short. And vice versa there is lot longer words in Finnish than in English. And as I said I need to include scandinavian letters anyways so I don't mind writing different content.
Norwegian and Danish use æ, ø, and å. Icelandic has some extra interesting letters that stem from old Norse: ð and þ. These are stress cases, which is why they matter.
Norwegian and Danish have a tendency of concatenating words like this: Næringsmiddeloppbevaringsgjenstander.
In Icelandic, a word in actual use today is Alþjóðaflutningaverkamannasambandsins.
The Wikipedia page on long words is quite interesting:
I'm definitely gonna use epäjärjestelmällistyttämättömyydellänsäkäänköhän