2.2 Kódování znaků
Protože počítač primárně pracuje pouze se stavy 0 a 1, respektive čísly, které jsou převedeny do vyjádření ve dvojkové číselné soustavě, musí existovat způsob, jak pomocí nul a jedniček zakódovat znaky abecedy. Kódování znaků abecedy rozeznáváme dva druhy. Osmibitové (8 bits) a třicetidvoubitové (32 bits). Existuje i kódování šestnáctibitové, ale o tom se dále zmiňovat nebudeme. |
Kódování |
Osmibitové kódování umožnuje jednoznačně rozlišit (zaznamenat) 256 (256=28) různých znaků. Kódování pak znamená např., že číslo 64 představuje znak a, číslo 65 znak b apod. Znaky mohou tedy být zakódovány hodnotami od 0 do 255. Během vývoje kódování vzniklo několik variant. Nejznámější je ASCII, které zaznamenává znaky anglické abecedy a další speciální znaky. Pro kódování východoevropských abeced známe např. kódování Windows-1250 nebo ISO-8859-2. Znaky a jim příslušející číselné kódy se nazývají znaková sada. Mnoho z abeced má své vlastní znakové sady v osmibitovém kódování. |
8 bits |
Některé abecedy, jako např. obrázkové (japonská, čínská), mají více než tisíc znaků. Ty není možné kódovat s pomocí osmi bitů. Z tohoto důvodu (ale i jiných) vzniklo 32-bitové kódování. Toto kódování je označováno jako tzv. UNICODE. Díky tomu, že umožňuje zaznamenat 232=4294967296 různých znaků, je možné pomocí UNICODE zaznamenat všechny abecedy světa. Výhodou pak je jednotné použití jediného kódování pro všechny jazyky světa. UNICODE je stále více podporován, přesto se však stále ještě setkáte s nedostatkem fontů pro toto kódování. Je totiž velmi komplikované sloučit patkové písmo s obrázkovým, apod. Malá poznámka na závěr. Díky kódování UNICODE je sice dnes možné soubory a složky v počítači pojmenovávat s diakritikou (případně obrázkově), přesto prosím toto nikdy NEDĚLEJTE!!! Pro pojmenování používejte pouze znaky a(A)-z(Z), 0-9, pomlčku, podtržítko a tečku. |
32 bits |
Často se stane, že budete potřebovat převést text z jednoho kódování do jiného. Pro kódování východoevropských abeced a UNICODE použijte na MS Windows program zvaný Mlaticka, případně proveďte převod pomocí WWW prohlížeče (jen pro otrlé a znalé základů jazyka HTML). Na GNU/Linux pak využijte program cstocs. |
Nástroje pro převod |
KONTROLNÍ OTÁZKA |
|
|
Uveďte typy kódování znaků abecedy -- vysvětlete rozdíly |