Asistivní technologie (01ASTE) - 1. přednáška - Hlasový výstup a screen-reader

Z Jaderňácká wiki
Verze z 20. 9. 2010, 16:14, kterou vytvořil Brindkar (diskuse | příspěvky) (Jsou klávesnice pro psaní bez zrakové kontroly, oproti standartním modelům, nějak specifická?)

Přejít na: navigace, hledání

Tento materiál vznikl s využitím připravované Metodiky výuky práce s počítačem bez kontroly zrakem.

Copyright © 2010 R. Seifert, W. Gonzúrová

Obsah

Hlasový výstup a screen-reader

Co znamenala devadesátá léta 20. století pro práci s počítačem bez kontroly zrakem?

Novodobou historii speciálních nástrojů, určených ke kompenzaci zraku co by dominantního smyslu při práci s počítačem, datujeme přibližně do počátku devadesátých let 20. století. V té době se v bývalém Československu začaly prosazovat osobní počítače vybavené operačním systémem MS-DOS, který spolu s využitím hlasových a hmatových výstupů jako první v historii počítačů umožnil smysluplnou a koncepční práci i nevidomým uživatelům. Tehdy, ostatně stejně jako dnes, připadaly právě sluch a hmat v úvahu co by smysly, které mohou kompenzovat zrak při používání vizuálního počítačového rozhraní.


Proč byl operační systém MS-DOS považován pro práci bez zrakové kontroly za uživatelsky přívětivý?

I poměrně dlouho poté, co počítače s operačním systémem MS-DOS zmizely z našich pracovních stolů a byly nahrazeny progresivnějšími nástupci, vzpomínala nemalá část nevidomých uživatelů na „dosovskou dobu“ s určitou nostalgií. Důvodem bylo, že DOS nabízel jednoduché textové rozhraní, u něhož se metodika práce s počítačem pro nevidomé a vidící uživatele lišila jen minimálně. Komunikace se systémem se odbývala téměř výhradně v jediném vstupním místě, prezentovaném příkazovou řádkou pod systémovými výpisy a hlášeními. Výpisy systému byly uspořádány lineárně (v jednotlivých řádcích), tedy způsobem principiálně výhodným pro uživatele hlasového i hmatového výstupu. Nejznámějším zástupcem hlasových výstupů pro textové rozhraní operačního systému DOS byl program KUK, jehož autorem byl nevidomý Jiří Mojžíšek.


Jaký dopad pro práci bez kontroly zrakem měla změna rozhraní operačního systému z textového na grafické?

Změna uživatelského rozhraní z textového na grafické si vyžádala i výraznou změnu speciálních nástrojů. Hlasové programy, jejichž hlavní - a z uživatelského hlediska mnohdy jedinou - úlohou bylo předčítat příslušný text, se musely vyrovnat s diametrálně odlišnou koncepcí práce s operačním systémem, což v důsledku znamenalo na jedné straně neustálé navyšování jejich funkcí a na straně druhé zvyšující se uživatelskou náročnost. Uživateli již nestačilo nechat program pouze předčítat, nýbrž musel začít spolurozhodovat o tom kdy, kde a co konkrétně bude hlasový program interpretovat. Takovému rozhodování nutně předchází analýza situace, která se stala základem principu výuky počítačové gramotnosti pro práci bez kontroly zrakem.


Které vstupní zařízení je při práci s počítačem bez kontroly zrakem obvyklé a nenahraditelné?

Nejobvyklejšími vstupními zařízeními pro komunikaci s počítačem jsou klávesnice a myš. Preferování jednoho z nich závisí na účelu, k jakému je počítač převážně používán. Tato skutečnost ovšem platí obecně. Nevidomí uživatelé standardní myš využívat nemohou, protože pohyb ukazatele myši po obrazovce je postaven čistě na vizuální kontrole. Myš je navržena pro druh práce, při které uživatel na jedné straně intuitivně vybírá požadovaný objekt a na straně druhé k němu koordinovaně, byť libovolnou trajektorií, přesouvá ukazatel myši. Ostatně koordinace pohybu ruky s pohybem ukazatele po obrazovce patří k základním dovednostem vidícího uživatele, jejíž nácvik ve výuce počítačové gramotnosti nelze opomenout. Pro práci bez kontroly zrakem proto nezbývá než jako hlavní vstupní zařízení použít klávesnici.


Je klávesnice pro psaní bez zrakové kontroly, oproti standardním modelům, nějak specifická?

Předně je třeba zdůraznit, že klávesnice, kterou nevidomý uživatel při práci s počítačem používá, je zcela standardní a nijak se neliší od klávesnice používané uživatelem vidícím. Správná technika psaní na klávesnici nepředpokládá zrakovou kontrolu, proto ten, kdo na klávesnici nevidí, není při psaní nijak hendikepován. Avšak psaní „všemi deseti“ bez kontroly zrakem vyžaduje, aby daná klávesnice měla pro uživatele očekávané rozložení kláves a pisatel se mohl opřít o její dostatečně přehlednou strukturu.

K čemu slouží hlasová odezva klávesnice?

I když pohyb prstů při psaní nevyžaduje kontrolu zrakem, uživatel má možnost psaný text průběžně číst z obrazovky a tím jej zároveň kontrolovat. Pro tento typ kontroly slouží nevidomému uživateli hlasová odezva klávesnice. Jedná se o funkci hlasového výstupu pro hlasité vyslovování stisknutých kláves. Díky hlasové odezvě může nevidomý uživatel průběžně sledovat správnost zapisovaného textu i vkládaných příkazů. Při psaní na klávesnici tak nevidomý uživatel oproti uživateli vidícímu není v zásadě nijak znevýhodněn.


V čem spočívá hlavní přínos horkých kláves a klávesových zkratek?

Všude tam, kde je třeba, aby se uživatel pohyboval v operačním systému, popřípadě pracoval s jednotlivými aplikacemi a jejich nabídkami, existuje v použití klávesnice a myši značný rozdíl. Myší lze klikat na objekty, rozmístěné po celé ploše obrazovky, relativně rychle a hlavně nezávisle na jejich vzájemné poloze. Prostřednictvím navigačních (kurzorových) tlačítek klávesnice je naproti tomu možné se pohybovat pouze mezi sousedícími objekty, a to krok za krokem. Takový postup by byl značně zdlouhavý, zvláště pokud by požadované objekty byly od sebe vzdáleny. Proto se při užívání klávesnice doporučuje používat horké klávesy a klávesové zkratky, které práci nejenom usnadňují, ale i zrychlují. Frekventované horké klávesy a klávesové zkratky aplikací jsou tudíž nezbytnou součástí osnov kurzů práce s počítačem bez kontroly zrakem. Dodejme však, že učení se jejich dlouhým seznamům nazpaměť nebývá účelné, neboť existují způsoby, jak jednotlivé kombinace kláves v průběhu práce zjišťovat.


Jak může hmatový displej sloužit i coby vstupní zařízení?

Uživatelé hmatových displejů mají ovšem ještě další možnost, jak komunikovat s počítačem. Jednotlivé modely displejů jsou vybaveny řadou takzvaných dotykových tlačítek, umístěných buď nad, případně pod čtecí oblastí. Tlačítka slouží k simulaci kliknutí nebo poklepání (dvojkliku) myší, čímž lze displej využít i jako vstupní zařízení. Uživatel hmatového displeje tak může pracovat do jisté míry obdobně jako uživatel standardní myši, avšak v praxi lze tuto simulaci používat jenom omezeně a v odůvodněných případech. Příčin je hned několik: předně je prostřednictvím hmatového displeje nesrovnatelně horší orientace na obrazovce, než jakou má vidící uživatel, a také tento způsob práce předpokládá poměrně dobré povědomí o rozložení objektů, které pochopitelně nemusí být vždy stejné. Na druhé straně je simulace myši občas velice vítaná a nesmírně efektivní, protože ji lze použít v situacích, kdy klávesnice buď daný krok neumožňuje, nebo zbytečně komplikuje.


Existují plnohodnotné alternativy klávesnice co by vstupního zařízení, jestliže pracujeme bez zrakové kontroly?

Pro úplnost uveďme, že komunikovat s počítačem lze i pomocí stále se rozvíjejících hlasových systémů, kde coby vstup slouží běžný mikrofon. Ve spojení s příslušným softwarem lze hlasem počítač ovládat nebo převádět mluvený projev na psaný text. Vývoj obdobných systémů není ovšem veden potřebou nevidomých ani slabozrakých uživatelů, kterým může prospět pouze tehdy, když nemohou z jakýchkoli důvodů používat standardní klávesnici. Nevidomý uživatel by za běžných okolností byl obdobnými systémy omezován a z hlediska rozvinutí jeho počítačových schopností a dovedností také zbytečně limitován.


Který smysl je dominantní při práci s počítačem bez kontroly zrakem?

Při práci s počítačem, stejně jako v běžném životě nevidomého člověka, je sluch bezesporu dominantním smyslem. Ucho jako telereceptor přijímá zvukové podněty z menší či větší vzdálenosti, analogicky jako oko. Proto – pokud nelze využít zrak - je poslouchání naprosto přirozené a při práci s počítačem rychlé. I při používání sluchu se však setkáváme s celou řadou úskalí, přičemž některá z nich jsou objektivní a uživatelem neovlivnitelná jiná může uživatel ovlivnit zcela, nebo alespoň částečně.


Je možné nejmodernější hlasové syntézy považovat za přirozený lidský hlas?

Úskalím, uživatelem prakticky neovlivnitelným, je nepřirozenost hlasové syntézy, tedy hlasu, jehož prostřednictvím se k uživateli dostávají informace zobrazené na monitoru. I když od dob prvních syntéz prošel tento typ softwaru velkým vývojem a dnešní hlasy jsou s těmi původními těžko srovnatelné co do přirozenosti i srozumitelnosti, nelze je považovat za přirozený lidský hlas.


V čem spočívá úskalí předčítaného textu, který je vnímán výhradně sluchem?

Jestliže je text někým (nebo něčím) pouze předčítán, čtenář zpravidla nezískává průběžné informace o jeho struktuře, nýbrž je mu prioritně předáván po obsahové stránce. Určitý problém způsobuje i skutečnost, že jednotlivé syntézy mohou jen s určitou pravděpodobností interpretovat správně veškerou slovní zásobu daného jazyka (například angličtiny). Tvůrci syntéz se rovněž snaží o to, aby čtení informací bylo maximálně přirozené a srozumitelné, a proto vytvářejí pravidla také pro výslovnost zkratek a symbolů; tato pravidla ovšem ne vždy respektují – a ani respektovat nemohou – významový kontext, pro který mohla být původně zamýšlena. Vyslovovaný text tak může obsahovat nelogičnosti, se kterými se uživatel musí umět v praxi vyrovnat.


Čím lze nahradit intuitivní způsob práce s počítačem, využívaný vidícími uživateli, jestliže pracujeme bez zrakové kontroly?

Z hlediska úspěšného používání hlasového výstupu je naprosto klíčová dovednost orientovat se jeho prostřednictvím v uživatelském rozhraní dané aplikace. Při práci sluchem nelze využít intuitivní, pro zrak určenou navigaci, prostřednictvím které se vidící uživatel může často zorientovat i v neznámém rozhraní. Nevidomý uživatel si proto musí pamatovat celou řadu kroků a instrukcí, souvisejících s chodem programu, a analyzovat nejasné či sporné situace. Někdy je nutné, aby při snaze o jejich vyřešení bylo použito i takových funkcí hlasového výstupu pro čtení obrazovky, které mohou přinášet netříděné a občas až zavádějící informace. Přestože je analýza takto získávaných informací krajně obtížná, lze kvalitním výcvikem mnoha nesnázím v orientaci a navigaci předejít.


V čem spočívá náročnost formátování textu pomocí hlasového výstupu?

V textu vyžaduje orientace a navigace neustálé uvědomování si jeho struktury, čehož lze dosáhnout pouze cílenými navigačními úkony jako jsou nalézání začátků odstavců, stránek a jiných logických částí dokumentu. Texty, které nevidomý uživatel vlastnoručně vytváří a u nichž se předpokládá reprezentativnější úroveň zpracování, vyžadují i další specifické nároky, spočívající zejména v potřebě opakovaného ověřování aktuálních atributů formátování. Jednotlivé atributy ovlivňující formát dokumentu musejí být za pomoci sluchu cíleně zjišťovány, měněny a posléze opět kontrolovány. Právě formátování dokumentů patří k časově nejnáročnějším a nejméně přehledným činnostem, při níž se náročnost práce s kontrolou sluchem projevuje obzvláště výrazně.


Co může ovlivňovat uživatelem nastavená rychlost vyslovování hlasové syntézy?

Vedle objektivních a uživatelem jen obtížně ovlivnitelných faktorů, které mají dopad na kvalitu vnímání informací pomocí sluchu, existují i takové, jež ovlivnit lze. Typickým příkladem je rychlost vyslovování textu hlasovou syntézou. Není neobvyklé, že nevidomí uživatelé nastavují vyslovování na nejvyšší možnou úroveň, aby tím zrychlili svou práci, popřípadě čtení dokumentů. Jedná se ve své podstatě o snahu přiblížit se, pokud jde o rychlost práce s počítačem, vidícímu uživateli, jehož čtení v duchu je rychlejší než kterýkoli vyslovovaný text. Daní za tuto snahu však někdy bývá menší uživatelova pozornost při čtení. Stává se, že v záplavě rychle za sebou navazujících sekvencí informací bývá přeslechnuta ta nejpodstatnější, nebo je text, byť souvislý, vnímán velice povrchně. Otázkou samozřejmě je, zda tento druh nepozornosti připadá na vrub hraniční srozumitelnosti syntézy při maximální rychlosti vyslovování, nebo skutečnosti, že je uživatel zahlcován velkým množstvím informací v krátkém čase. Lze předpokládat, že oba tyto faktory hrají určitou roli.


Jaký důsledek může mít čtení sluchem pokud jde o pravopis?

Musíme však ještě zmínit obrovské nebezpečí plynoucí ze čtení sluchem, zvláště není-li kompenzováno jinými způsoby čtení. V plynule vyslovovaném textu nemáme šanci poznat, zda se ve slově píše měkké i nebo tvrdé y, případně s nebo z, a tak čtení textu vlastně ani neudržuje, ani nerozvíjí povědomí o jeho psané podobě (pravopisu). Znalosti pravopisu jsou za běžných okolností udržovány v podstatě banální skutečností, že vizuálně vnímáme psanou podobu slov – a tím i jejich správný pravopis. Pouhým posloucháním není vizuální paměť podporována, a to ani její obdoby – například paměť haptická. I když existují nástroje v rámci speciálního softwaru, jak pravopis ověřit, bylo by neúměrně pracné, zdlouhavé a navíc neúčelné tak činit v průběhu čtení. Jednoduše nelze současně vnímat obsah i formu textu. Avšak pokud nevidomý člověk zcela rezignuje na metody ověřování správného zápisu a nevytvoří si vlastní strategie pro oživováni si pravopisných pravidel, jeho psaný projev nevyhnutelně postupně degraduje. Neznalost pravopisu přitom neovlivňuje ani tolik počítačovou gramotnost konkrétního jedince, jako spíše komplikuje jeho sociální integraci.


Je sluch při práci s počítačem bez kontroly zrakem nahraditelný?

Přes veškerá negativa, na která jsme upozornili, je kompenzace sluchem při práci s počítačem bez kontroly zrakem nenahraditelná a nelze tudíž doporučit navržení speciální počítačové sestavy bez hlasového výstupu. Převod informací do hmatové podoby lze považovat za doplňkový, i když právě hmatový výstup ve spojení s výstupem hlasovým posouvá možnosti uživatele na kvalitativně vyšší úroveň.