Vyšlo v Softwarových novinách č. 8/2000
Vytištěno z adresy: http://www.earchiv.cz/a008s200/a008s203.php3

Digitalizace hlasu

Lidský hlas, snímaný vhodným mikrofonem, je převáděn na analogový signál. V dřívějších analogových sítích jej bylo možné dále přenášet přímo v této jeho analogové podobě, ale v sítích digitálních musí být nejprve zdigitalizován, neboli převeden do digitální podoby. To se týká vnitřku veřejné telefonní sítě , která dnes již funguje také z větší části digitálně (ale nikoli na okrajích ke kterým se připojují koncoví uživatelé, zde funguje ještě analogově), a samozřejmě také sítě ISDN, která již je celá digitální (funguje digitálně až ke koncovým uživatelům). Obě tyto sítě, tedy klasická telefonní i ISDN, používají velmi jednoduchý a také velmi neúsporný způsob digitalizace, konkrétně označovaný jako PCM, neboli: Pulse Coded Modulation. Předpokládá nasnímání vzorku analogového signálu 8000x za vteřinu (resp. 1 x každých 125 mikrosekund), a vyjádření velikosti (hodnoty) tohoto vzorku jako 8-bitového čísla. Triviální výpočet říká, že tímto způsobem vzniká 64 kilobitů za sekundu (8000 vzorků za sekundu, o 8 bitech každý, tj. 64 kbps). Proto také byly přenosové cesty v digitální části klasické telefonní sítě (a v celé síti ISDN) dimenzovány právě na tento "tok" 64 kbps - pro každý jednotlivý hovor je zde vyhrazen přenosový okruh 64 kbps.

Sítě GSM však vznikaly poněkud později, v době kdy již lidé znali a uměli používat mnohem efektivnější metody digitalizace, umožňující vystačit s mnohem menšími přenosovými rychlostmi, resp. s menšími přenosovými kapacitami. Proto se v GSM používá podstatně propracovanější způsob digitalizace lidského hlasu, který také generuje výrazně menší objem dat která musí být následně přenesena. Standardně se v GSM používá metoda, která snímá vzorek přenášeného hlasu každých 20 milisekund a kóduje jej pomocí 260 bitů. To odpovídá 13 kilobitům dat generovaných za sekundu, a pro jejich přenos by bylo zapotřebí stejně velké přenosové rychlosti.

Tok dat, vznikající rychlostí 13 kbps, by již bylo možné považovat za "obecná data", která by mohla být přenesena tak jako kterákoli jiná data na druhou stranu a zde z nich byl zpětně rekonstruován lidský hlas. Ovšem hlas přenášený mobilní sítí musí být chráněn před různými zkreslujícími faktory, kterých je v GSM sítích opravdu požehnaně, a které se prakticky projevují nejrůznějšími chybami při přenosu dat. jejich vliv je samozřejmě nutné eliminovat, a řešením je vhodné kódování.

V GSM se používají různé algoritmy kódování podle toho, zda je přenášen zdigitalizovaný lidský hlas nebo "obecná" data. V případě hlasu se používá konvoluční kódování, které k přenášeným datům přidává určitou míru redundance a umožňuje příjemci opravit některé chyby vzniklé při přenosu. V důsledku toho ale dochází i ke zvětšení objemu dat, které je třeba přenést - ze vzorku o velikosti 260 bitů, který je generován každých 20 milisekund, se po takovémto zakódování stává vzorek o velikosti 456 bitů (stále generovaný každých 20 milisekund). Za 120 milisekund je tak vygenerováno 6 x 456 bitů, neboli 2736 bitů - což je na bit přesně tolik, kolik "pojme" jeden slot (resp. jeden logický kanál) v celém multirámci, viz výše. Nebo také: ze 13 kilobitů "čistých" hlasových dat se stává oněch 22,8 kbps, které plně vytíží přenosové schopnosti GSM kanálů.

Představa přenosu hlasu v sítích GSM