Lokutus
Ego sum Lokutus flagellum dei

Proč ne IDN?
8.12.2008
buzz

Na lupě se objevil článek, který je dosti skeptický k zavádění IDN. Rozjela se pod ním diskuse, ze které vyplynuly nějaké skutečnosti.


Můj názor je, že celý segment informačních technologií směřuje dlouhou a trnitou cestou od nelidských jedniček a nul a prapodivných implementací různých hardwarových a komunikačních rozhraní k lidem srozumitelnému přístupu. Je to naprosto logické. Počítač je jen další z mnoha nástrojů, určených lidem, jako je lopata, traktor, nebo zápisník s tužkou.

Každý nástroj zcela nepopiratelně prošel svou cestou optimalizace. Lopata byla kdysi možná kus pevné a široké kůry, nebo velký placatý kámen, kterým se odhrnovala hlína stranou. Pak možná někoho napadlo přidat jí násadu, protože se to bude líp držet a využije se tak větší síla. A pak někoho třeba napadlo, že by ta odhrnovací část mohla mít pravidelný tvar, který směřuje do špičky. Další ohobloval násadu, aby se mu nezadíraly třísky do ruky.

Počítače byly kdysi určeny pouze lidem co jim rozuměli – svým tvůrcům. Komunikačním rozhraním byly různé stavové automaty. V podstatě se s počítačem komunikovalo jeho řečí – binárně. Jenže uběhla nějaká doba a počítače se začaly přibližovat lidem. Ke komunikaci vznikly znakové sady a různá hardwarová udělátka, jako klávesnice, nebo myš. Pak někoho napadlo, že by bylo fajn, povídat si s počítačem ve svém rodném jazyce, tedy včetně různých speciálních znaků, jako je dlouhé Á, přehlasované Ö nebo Ř. A tak vznikly rozšířené znakové sady. Trvalo to nějakou dobu, ale nakonec se uchytil mezinárodní standard, který zahrnuje všechny znaky na světě, takže lidi si teď můžou navzájem psát v různých jazycích. Prostě vývoj.

Avšak pořád jsou oblasti, kde se tento vývoj zatím ještě neobjevil. Například URI. URI je identifikátor internetové stránky, nebo taky internetová adresa. Má dva možné lidské tvary, číslo anebo název. Oba tvary jsou naprosto jednoznačné a nedají se zaměnit. Pokud napíšete do adresního řádku prohlížeče seznam.cz a 77.75.72.3, dostanete se na stejné místo. První tvar je tedy výsledkem polidšťování počítačů, protože místo nicneříkajícího čísla dává internetové stránce zapamatovatelnou adresu.

IDN jde ještě dál v polidšťování. Když zadáte zive.cz, dostanete se na portál o IT. Je to vlastně název toho portálu bez háčků a čárek – Živě.cz. Fajn. Ale co když se bude chtít někdo zabývat živými tvory, a to na webu Živé.cz? A jiný bude chtít web Zíve.cz o zívání? Tak dneska mají smůlu, neboť adresa zive.cz je již obsazena. Musí si vybrat jiný název.

Ovšem IDN má své odpůrce, kterým se to nelíbí. Odpůrci říkají, že:

  • třeba ve Francii, nebo jinde ve světě, kde nebudou mít českou klávesnici, adresu s háčky a čárkami nezadají
  • to zvýší náklady firem, které si budou muset registrovat víc variant, jednak variantu bez HaČ, kvůli tomu, že je ta doména známá, druhak s HaČ, aby jim jí nějaký doménový spekulant nevyfouknul
  • je v tom riziko, neboť některé cizí znaky vypadají stejně, jako jiné české znaky a tak by se některé weby (třeba internetové bankovnictví) daly snadno podvrhnout, což je bezpečnostní riziko
  • a vůbec s tím bude hromada práce a problémů a za to to nestojí, když to funguje, tak se v tom nevrtej

První bod je jistě velmi závažný. Když pojedu na dovolenou k moři a budu chtít vidět nějaký český web, ke kterému znám adresu, nebudu to moci zadat, protože tam nebude nainstalována česká klávesnice. Ovšem stejně tak nebudu moci domů napsat e-mail hezky česky, nýbrž jen osklive necesky bez hacku a carek jako mongol. A zásadní problém budu mít v Číně, nebo Saudské Arábii, kde nemusím najít ani klávesnici s latinkou. Budu si muset poradit a moji blízcí to budou muset louskat. No a stejně tak si budu muset poradit s tou češtinou v adrese webu. Najdu si to třeba přes Google, anebo odkazem z jiné, známé stránky. Anebo si před cestou napíšu na kousek papíru IP adresu. Anebo holt nepolezu na web, který je určen Čechům v Česku, neboť má českou adresu. Fakt je, že taky jedu do Lucerny na adresu Vodičkova 36, a nikoliv Vodickova 36. Jsme Češi, žijeme v Česku (nebo Čechách) tak používejme Češtinu.

Kromě toho, je to jenom důvod začít se poohlížet po nových a lepších komunikačních platformách, jako třeba OLED, či laserové klávesnice, ovládání hlasem apod. Tomu říkám vývoj, pokrok, a ten jde vždy kupředu. Koncepčně zastaralé hardwarové klávesnice s omezeným počtem znaků, navíc se stupidním rozložením, které vzniklo historicky kvůli tomu, aby se nezasekávaly psací stroje, jsou už beztak zralé na odpis. Jistě se najde hromada alternativ, které budou lepší a budou řešit tento problém takříkajíc internacionálně.

Druhý bod je podle mě dost sporný. Problémy budou jistě při přechodu na nový systém. Z důvodu zpětné kompatibility a zvyku bude potřeba jistě ještě nějaký čas udržovat i variantu adresy bez diakritiky. Ale časem si lidé zvyknou na nové adresy a ty staré ASCII varianty nikoho zajímat nebudou. Jde jen o dočasný stav při přechodu. Jako vždy, každý přechod mezi dvěma systémy je náročný.

Třetí bod beru jako jedinou závažnou výtku. Ano, to riziko tu je. V některých znakových sadách existují znaky nachlup stejné, jako jiné české znaky. V takovém případě samozřejmě nebude problém podvrhnout adresu třeba internetového bankovnictví a získat tak hesla k bankovním účtům. To už se děje dnes, těm technikám se říká phishing a pharming. S IDN bude stačit zaměnit jedno písmenko v adrese IB za stejné písmenko, avšak z jiné znakové sady a adresa povede jinam, přestože bude nachlup stejná.

Můj názor na tuto problematiku je poněkud obsáhlejší. Podle mě je riziko podvržení adresy IB jen zástupný problém. Zásadní pravidla bezpečnosti by neměla být takto zjednodušená. Zkontrolovat si cílovou adresu by mělo být jen jedno z mnoha pravidel bezpečnosti a každopádně jedno z těch minoritních. Adresa internetového bankovnictví není podstatná a takový pharming v reálném světě by vypadal asi tak, že by vás měl taxikář zavézt do vaší banky, ale on by vás místo toho zavezl na místo, kde by byl nachlup stejný barák s logem vaší banky a tam by z vás podvodně vytáhli váš podpisový vzor, třeba.

Hlavní bezpečnostní prvky při přístupu ke svým penězům přes internet jsou certifikáty, šifrovaná komunikace a další, třeba čipová karta, apod. Nikoliv jen jméno a heslo. Kdyby lidé byli opatrnější na své peníze, rhybáři a pharmáři by utřeli nosy a šli by krást jinak.

A tedy na podvrženou adresu může naletět jen blb, anebo člověk, kterému je to jedno, protože na účtu nemá permanentně prachy.
Každopádně v rámci IDN se i tyto problémy dají řešit a jistě se časem objeví řešení více.

Poslední bod je pak tradiční skuhrání lemry líný, která by nejraději nechala všechno jak je a na nic by nesahala. To je špatný přístup.

Naopak jako důležitý bod zastánce IDN říkám, že IDN je user friendly. Průměrný volič Paroubka si bude chtít prohlédnout stránky své oblíbené strany, ale ejhle, http://www.čssd.cz/ neexistuje. Jakto?

Nedávno jsem jel za dodávkou, která měla na boku reklamu na něco jako www.Vaše-Kancelář.cz.
Říkám si, jasně, já vím, že je to nonsense a URL zní vase-kancelar.cz, ale ví to támhleten strejda v té modré oktávce? Anebo ta ženská, co stojí na chodníku a čeká na zelenou? Třeba zrovna v nějaké firmě pořizuje kancelářské potřeby a teď zkusí zadat tuhle human readable URL do prohlížeče.
A pak je tu dilema té dodavatelské firmy, jak popsat co nejjednodušeji název své firmy, aby to bylo čitelné, jednoznačné a co nejkratší.
Vaše Kancelář na www.Vase-Kancelar.cz? Nebo www.Vaše-Kancelář.cz a doufat, že lidé jsou dostatečně chytří, že to zadají bez diakritiky? Dilema.

A to nemluvím o speciálních znacích, které vydají víc, než dlouhý popis. Třeba 卐.com. Proč si nedat na matematický web do adresy odmocninu? Nebo znak sumy?

A s tím souvisí druhý bod mé obhajoby, a tím je, co je komu do toho, jakou doménu si pro svůj web kdo vybere? Pokud někdo chce zůstávat u ASCII sedmibitových domén, be my guest, ale nechte ostatní, ať se rozhodnou sami. Třeba když si budu chtít udělat stránky svého psa a zaregistruji si adresu můj-pes-Amálka.cz, tak je to jen a jen moje věc a je mi buřt, že

  • se na amálku nedostane nikdo ze zahraničí bez české klávesnice
  • si někdo může zaregistrovat ASCII variantu muj-pes-Amalka.cz
  • to může někdo podvrhnout

Třetí bod  mé obhajoby souvisí s tím, že zadávat adresu je přežitek a časem to bude naprostá zbytečnost. Weby budou cílit na indexaci, fulltextové vyhledávání a přitáhnutí lidí z vyhledávačů.

Poslední bod mé obhajoby IDN je jednoduchý a myslím  dostatečně vypovídající. Jsou země, kde už IDN zavedené mají a u nás je to jen otázka času, protože pokrok nezastavíš. Časem třeba dospějeme k tomu, že adresa webu bude naprosto čitelná, a to bez dalších ptákovin jako jsou TLD, nebo protokoly. Vyhledávání informací bude intuitivní a počítač bude rozumět i banálnímu popisu - třeba, "chtěla bych najít informace ohledně jedný akce, bylo to v Praze někdy na jaře a v nějakém parku a vím, že tam bylo hodně lidí a pil se tam alkohol..."

linkuj.cz vybrali.sme.sk

Komentáře

(#13 - WWW, 08.12.2008, 22:56:39)
Jakkoliv jsem určitě příznivcem nových věcí, se zaváděním diakritiky do URI nesouhlasím právě z důvodů zmíněných.

Jako řešení problému, že někdo napíše čssd.cz, bych viděl, že prohlížeč bude mít nadefinováno, že v adrese má č převádět na c a obdobně.

(Lokutus - WWW, 09.12.2008, 13:01:04)
Tím pádem souhlasíš s komunismem v IT. ;-)

Jinak tyhle pluginy v prohlížeči už se zkoušely, ale byly opuštěny. Není to koncept, je to bastl.

(#13 - WWW, 09.12.2008, 18:34:47)
Podle mě nejde o komunismus, ale nevýhody převažujou nad výhodama, IMHO.

(Lokutus - WWW, 10.12.2008, 11:55:44)
No jo, ale nevýhody pro koho? Nikdo nikoho nenutí si zařizovat IDN. Kdokoliv může zůstat u ASCII domény. IMHO. :-)

(#13 - WWW, 12.12.2008, 10:51:00)
To jistě. Ale jde o to, že někdo cizí si může zaregistrovat podobnou doménu, jak jsi o tom ostatně psal.

(Lokutus - WWW, 13.12.2008, 17:11:12)
No jistě, ale to je jen komplikace. Vyzývá k tomu, aby byla vyřešena. Ne aby se problematika IDN navěky zašlápla.
Každý problém lze vyřešit. Avšak ne tak, že to celý zahodíme a zapomeneme.

Problém se vyřeší takříkajíc internacionálně (Ender - Mail, 10.01.2009, 02:28:04)
Teda co se jeden nedozví za věci. Vidím docela zásadní rozdíl mezi tím, kdy domů napíšu mail bez diakritiky a kdy domů mail nenapíšu žádný, neboť má někdo adresu ve tvaru petr@novák.cz, zcela pomíjeje mizernou podporu IDN v mailových klientech a rozhraních (ta se samozřejmě časem vyřeší).
Jakým způsobem proboha řeší laserová klávesnice problém nedostupné české keymapy? (ano, vím že jste neřekl, že řeší, ale poskládání vět a slov to minimálně naznačuje...) I kdyby se nakrásně rozpoznávání hlasu dostalo do stavu použitelnosti pro diktování, rozhodně nebude fungovat bez "lokalizace" pro daný konkrétní jazyk (nestalo se Vám nikdy, že jste kvůli očekávání špatného jazyka nějakou dobu nemohl porozumět? i u strojového zpracování je to dost stejné) a jsme opět u nedostupné "keymapy".

Dneska si někdo může na auto napsat adresu s diakritikou právě proto, že už si dostatečná masa lidí zvykla na psaní domén bez ní.

To, že jsou země, kde IDN zavedeno bylo, mi přijde podobné jako když někdo skočí z okna, že je správné ho následovat...

Plus bych podotkl, že doménové jméno sice lze převést na IP adresu, ale zpátky už to nejde 1:1. Tedy napsat do prohlížeče IP adresu možná funguje pro Seznam, ale zkuste si to třeba tento blog. Nicméně přecejen by si šlo něco před cestou připravit a to variantu adresu převedenou do verze bez diakritiky (což normálně udělá prohlížeč rozumějící IDN).

Plus další faktické chyby, ale už ne podstatné pro pointu článku.

(Potwurka - Mail, 10.01.2009, 20:15:43)
Laserová nebo OLED klávesnice problém samořejmě vyřeší, neboť je softwarová. Tedy jedna klávesnice může zobrazit libovolné znaky z libovolné znakové sady v libovolném rozložení.
Unicode je už dneska faktický standard po celém světě a IDN jen urychlí jeho širší využití.

Ano, lidi si zvykli a proto si musí zvyknout i na IDN. Nic nepřijde samo.

Jsou země a funguje jim to. Analogii se skokem z okna nevidím.

Takže žádné faktické chyby nevidím. Jen váš strach z neznámého a neochotu přizpůsobit se novým trendům.

(Potwurka - Mail, 10.01.2009, 20:16:40)
Eh, podepsán Lokutus. :-)

(stoural, 31.01.2009, 23:58:13)
"Najdu si to třeba přes Google, anebo odkazem z jiné, známé stránky."

A jak to zadas? V tom Google? Zadas "Zive" a budes doufat, ze Google nebude považovat "živě" za něco jineho?

"Zkontrolovat si cílovou adresu by mělo být jen jedno z mnoha pravidel bezpečnosti"

Jak poznas ceske "c" od ruskeho "s"? Autor dobre otazky a odpovida na ne naprosto nesmyslnymi a vyslovene nepravdimi odpovedmi. Zkontrolujte si cilovou adresu. To me opravdu rozesmalo!

stoural (Lokutus - Mail - WWW, 03.02.2009, 23:50:32)
Google umí najít texty s diakritikou i bez. Nepochybně to bude umět i vzhledem k URI.

Proto v článku píšu, že kontrola cílové adresy by měla být jednou Z MNOHA pravidel bezpečnosti a každopádně je minoritní. Základem jsou uživatelské certifikáty, šifrovaná komunikace apod.

hmmm (DreamStealer, 02.11.2009, 10:04:54)
pekna kokotina...

btw, k tomu bodu 1, co ma spolocne obsah mailu zo zadavanim domeny? to akoze ked budem musiet zadat diakritiku do adresy, musim okamzite pouzivat diakritiku aj v contente? btw hovori ti nieco charmap? pripadne virtualne klavesnice? garantujem ti, ze v momente budu existovat stranky, ktore budu mat za ciel, ti do clipboardu drbnut tebou pozadovany znak z tvojej abecedy...

bod 2: co si predstavujes pod oznacenim prechod na novy system a spatna kompatibilita? to mi chces povedat, ze sa budu rozdelovat domeny na tie co su bez diakritiky zo stareho systemu a tie co su bez diakritiky, lebo proste diakritiku nepotrebuju?

bod 3: pekne od teba ze akceptujes bezpecnostne riziko phishingu pri bankach, ale napriek tomu sa ohanas certifikatmi, ktorym zrovna ludia pre ktorych je IDN robena (BFU) absolutne nerozumeju... ako rozoznas v ktorej znakovej sade bol napisany znak v url ked ti dojde link napriklad mailom, pripadne ho najdes na webe?

a vobec, co tu vlastne stracam cas... web tiez mizerny...

(Fany, 10.11.2009, 10:56:54)
Tvoje duvody jsou trosku spatne, to jsi rovnou mohl napsat toto:

1) Ze se muze podvrhnout adresa? to me nazjima, kdyz jim nekdo naleti, jeho chyba, je to blb a blbama se nezabyvam.

2) Ze kdyz budu v cizi zemi tak nebudu moct naspat mail? Ja v cizine maily psat nepotrebuju, a kdo jo, a neumi to je blb a blbama se nezabyvam.

3) Ze to frantici, cinane, arabasi to nebudou umet napsat? To me nezajima, kdo neni cech je blb a tema ja se nezabyvam.

4) Ze nemuzes v cizine (u more) lezt na ceske stranky? Kdyz jsi u more tak bud ve vode, kdyz nejsi vevode, pokud chces na web tak si to zarid jak chces, kdyz to nezvladnes jsi blb a blbama se nezabyvam.

4) Ze nejaka firma musi hlidat aby ji nejaky spekulat nekoupil podobne vypadajici domenu? Ja firmu nemam, me to neva, kdo ji ma at se stara, kdo to neumi je blb a blbama se nezabyvam.

Fany (Lokutus - WWW, 23.11.2009, 11:23:18)
Tos mohl(a) rovnou napsat:
Pokrok? To mě nezajímá. ;-)

(meeko, 23.11.2009, 13:13:13)
2Lokutus :
kdybyste rekl ze je to Vas nazor, nebylo by co vytknout, ale argumenty, ktere jste uvedl jsou skutecne slabe, velmi slabe, zhruba na urovni nazoru nez faktu, rekl bych ze to sice prehnane, ale docela trefne popsal Fany, a DreamSTar, specialne tu cast tykajici se podvrzeni adresy vs. certifikaty a zabezpeceni

meeko (Lokutus - WWW, 23.11.2009, 15:19:53)
Není to jen MŮJ názor. Vůbec to není názor. Je to realita. To se právě děje. Na generických doménách už to tak funguje a nikdo si nestěžuje. Naopak, názor (a hloupý) je, že bychom NEměli zavádět IDN, protože nějaký jouda přistupuje ke svým drahoceným penězům jen pomocí domény, loginu a hesla v plaintextu.

Nejde jen o certifikáty. Každá banka poskytuje další úrovně zabezpečení. Od obyčejných SMS, přes speciální SMS, až po čipové karty. To jsou nástroje, které zvládne i pitomec. Pak jakékoliv podvržení URI ztrácí smysl. Takže, co je na tom slabého?

meeko (Lokutus - WWW, 23.11.2009, 15:21:29)
Ještě dodatek.
Kdybyste nečetl prdelí, všiml byste si v úvodu článku noticky: Můj názor je,...

Pak byste nemohl napsat takovou kravinu.



Přidání komentáře...


Vaše jméno:


Váš e-mail:


URL vašich stránek:


Nadpis:


Text: