webdesign, webhosting, software, sítě, databáze
Každý problém má své řešení.
Každoroční odborná konference Common ČR a Common SR se letos bude konat ve dnech 3. – 5. června v Hotelu Rustikal v Horní Cerekvi. Kromě mnoha jiných zajímavých přednášek zde můžete zhlédnout a vyposlechnout si i přednášky Lukáše Jelínka: Opa – nový přístup k vývoji webových aplikací a Sieve – otevřený standard pro zpracování příchozí pošty.
Ve dnech 28.–29. března 2012 se v Jihlavě koná mezinárodní konference Open Source v evropské veřejné správě (součást projektu OSEPA). Součástí konference je i workshop, který se koná 26. a 27. 3. v pražském Hotelu ADRIA. Lukáš Jelínek na workshopu vystoupí se svým příspěvkem Benefits of Using OSS Licenses in Public Administration.
Propojení počítačů do sítě přináší má (oproti samostatným strojům) mnoho výhod. Nejlépe samozřejmě poslouží odborně navržená a důsledně spravovaná síť - ať už je jakékoli velikosti. Přesto je mnoho zájemců o vybudování sítě, kteří se do toho chtějí pustit sami. Nechť jim tyto zodpovězené otázky poslouží pro základní orientaci.
Nevíte, jak nainstalovat elektronický podpis nebo změnit výchozí šablonu? Máme pro vás únorový openMagazin s tématem „kancelář“.
Problém, jak řešit zakódování národně specifických znaků, se ve výpočetní technice řešil již od dřevních dob (přesněji řečeno od okamžiku, kdy chtěl někdo používat něco víc než holé anglickou abecedu). Pro české znaky se v historii používala mnohá kódování, každé mělo nějaké výhody a nevýhody (na legendární kódování bratří Kamenických si ještě leckdo vzpomene, občas ho ještě někdo použije i dnes). Po postupném vystřídání všeho možného jsem zjistil, že je nejvýhodnější používat UTF-8.
Pominu-li zmiňované bratry Kamenické a různé pokusy o národní kódování (říkám pokusy, protože třeba kódování KOI8ČS se neujalo, přestože bylo určeno ČSN jako "jediné správné"), stejně tak jako používání proprietárních kódových stránek, za první skutečně významný krok lze považovat zavedení skupiny kódování podle normy ISO 8859. Znaky české abecedy jsou součástí ISO 8859-2 (což asi každý ví), proto bylo (a stále je) naprosto běžné používat tuto sadu.
Protože přepínání kódových stránek se změnou jazyka je věc dost nepříjemná, objevil se fenomen zvaný Unicode - systém, který umožňuje snadnou práci s libovolným počtem národních abeced současně. Snaha o normalizaci tohoto systému vyústila v normu ISO/IEC 10646, která pokrývá hlavní část tohoto systému (a do budoucna se plánuje pokrytí celého standardu).
Unicode si samozřejmě nevystačí s jedním bajtem pro každý znak. Nejobvykleji se každý znak ukládá dvoubajtově (UCS-2), lze použít i čtyřbajtovou reprezentaci (UCS-4). Tyto reprezentace se hodí hlavně pro vnitřní uložení v paměti, pro ukládání dat a jejich přenos jsou vhodnější tzv. transformační formáty (UTF). Jsou v zásadě tři: UTF-8, UTF-16 a UTF-32 (u dvou posledních se rozlišují ještě varianty podle pořadí bajtů). Formát UTF-8 zakódovává každý Unicode znak jako osmibitové hodnoty, a to tak, že podle potřeby (resp. podle hodnoty) používá 1-4 bajty.
Právě UTF-8 jsem si v poslední době velmi oblíbil, zjistil jsem totiž, že mi přináší téměř samé výhody:
Samozřejmě, že UTF-8 má i své nevýhody. Texty zabírají více místa, ne všechny programy s nimi umí správně pracovat (hlavně ty starší), jsou hůře čitelné v ASCII reprezentaci, pro výměnu dat s jinými lidmi (kteří UTF-8 zatím nepoužívají) je nutná konverze apod. Ale výhody jednoznačně převažují, proto je pro mě UTF-8 dobrou volbou.
Článek byl původně napsán pro blog na serveru ABC Linuxu.
AIKEN s.r.o.
Lorecká 465, 284 01 Kutná Hora
tel. 312 312 413, mobil 606 362 315
www.aiken.cz, aiken@aiken.cz