Téčko: Tipy a triky pro JAWS - Integrované OCR

Tentokrát se v JAWS podíváme opět na jednu z doprovodných funkcí a sice integrované rozpoznávání textu čili OCR. To je na rozdíl od funkce Picture Smart určeno výhradně pro rozpoznávání textu a nikoli obsahu obrázků. Oproti Picture Smart probíhá veškeré rozpoznávání přímo na počítači. Odezva OCR je tedy rychlejší a nevyžaduje internetové připojení. JAWS pro OCR využívá knihovnu Kofax OmniPage 20, která by měla dosahovat dobré přesnosti v rozpoznávání a podporuje mnoho různých jazyků včetně češtiny a slovenštiny.

Na místě je samozřejmě otázka, zda je lepší pro rozpoznávání textu používat specializovanou OCR aplikaci, jako je ABBYY FineReader, nebo vestavěnou funkci JAWSu. FineReader bude pravděpodobně o něco přesnější a obsahuje řadu různých možností a nastavení, které bychom v JAWSu nenašli. Použití OCR v JAWS je naopak mnohem rychlejší – máme ho vždy při ruce na stisk několika málo kláves. Navíc je můžeme snadno využít i k rozpoznávání grafických prvků na obrazovce počítače. Pro rozpoznávání dokumentů lze obecně doporučit následující. Pokud potřebujeme rozpoznat text, který si chceme jako dokument trvale uložit a pracovat s ním (např. knihu), bude vhodnější použít FineReader. Pokud nám ale jde o rychlé jednorázové přečtení např. papírů, které jsme našli v poštovní schránce, bude efektivnější JAWS.

A jak tedy můžeme OCR v JAWSu využívat? Možností je mnoho – od převodu grafických souborů do textu, přes čtení naskenovaných papírových předloh prostřednictvím skeneru, až po rozpoznávání obsahu grafických prvků na obrazovce. Pojďme si tedy vše projít.

Rozpoznávání grafických souborů

Máme-li v počítači uložený soubor v grafickém formátu nebo třeba i PDF, které obsahuje pouze grafiku, můžeme jeho obsah velmi snadno převést do textu. Stačí jen soubor označit v Průzkumníku, otevřít k němu kontextové menu a v něm zvolit položku Rozpoznávání textu s JAWS. Za okamžik se text rozpoznaný v grafickém souboru zobrazí v Prohlížeči výsledků. Zde si jej můžeme procházet obdobně jako text v Poznámkovém bloku. Můžeme si jej číst nebo označit a přes schránku zkopírovat kamkoli jinam. V případě JAWSu 2021 najdeme na konci textu ještě odkaz pro otevření textu ve Wordu. Prohlížeč výsledků lze zavřít klávesou Escape.

Pokud máme v počítači nainstalovaný JAWS 2021, najdeme v kontextovém menu k souboru ještě položku Rozpoznávání textu do Wordu s JAWS. Tou můžeme také spustit rozpoznávání textu, a výsledky se nám otevřou přímo ve wordovském dokumentu.

V rozpoznaném textu je vždy zachováno základní formátování, jako je použitý font, velikost písma a podobně.

Rozpoznání grafického souboru můžeme kromě kontextového menu spustit také skupinovým příkazem JAWSu. Když budeme mít požadovaný soubor v Průzkumníku vybraný, stiskneme JAWSKey + mezerník pro vstup do režimu skupinového příkazu, a následně O pro otevření skupiny příkazů pro OCR. Poté vše završíme stiskem F pro rozpoznávání souboru. Po chvíli se nám opět otevře Prohlížeč výsledků s rozpoznaným textem. I rozpoznání do Wordu lze provést skupinovým příkazem, a sice JAWSKey + mezerník, O, R.

Už jsme zmínili, že JAWS může rozpoznávat také text v grafických dokumentech PDF. Když tak neučiníme přímo z Průzkumníka, ale pokusíme se PDF otevřít v Adobe Readeru, JAWS nás automaticky upozorní, když dokument neobsahuje žádný text, a nabídne nám jeho rozpoznání. Rozpoznání celého PDF dokumentu otevřeného v Adobe Readeru můžeme také kdykoli spustit skupinovým příkazem JAWSKey + mezerník, O, D.

Rozpoznávání naskenovaných předloh

Pro rychlé přečtení předlohy, kterou jsme vložili do skeneru, použijeme další skupinový příkaz a sice JAWSKey + mezerník, O, A. Po stisku této sekvence kláves se otevře skenovací dialog. Pokud nechceme měnit výchozí skener nebo parametry skenování, stačí dialog jen potvrdit klávesou Enter. Skenování se spustí a my budeme mít po chvíli opět otevřený prohlížeč výsledků s rozpoznaným textem. Ještě než se prohlížeč otevře, JAWS ohlásí orientaci stránky ve skeneru, např. „Stránka je orientována nahoru“. To je informace, kterou bychom zrovna z FineReaderu těžko získávali. Přitom se někdy může hodit vědět, kde má stránka vršek, kde spodek nebo zda není orientovaná na šířku. Jinak je skenování velmi snadné, bez jakýchkoli záludností.

Rozpoznávání grafických prvků na obrazovce

Čas od času můžeme narazit na prvek nebo celé okno v aplikaci, které není přístupné a JAWS v něm nic nečte. Typické to bývá např. u úvodních oken některých instalačních programů. I v takové situaci nám může pomoci OCR.

Příkazem JAWSKey + mezerník, O, W lze rozpoznat obsah celého aktuálního okna. JAWS se po rozpoznání přepne do režimu JAWS kurzoru. JAWS kurzorem si tedy pročteme veškerý rozpoznaný text v okně a pokud potřebujeme nějaký prvek v okně aktivovat, stiskneme na něm numerické lomítko pro simulaci kliknutí myší.

Kromě rozpoznávání celého okna máme v JAWS k dispozici také příkaz pro rozpoznání celé obrazovky (JAWSKey + mezerník, O, S) a také. příkaz pro rozpoznání jen určitého nepřístupného prvku, na němž právě stojí kurzor (JAWSKey + mezerník, O, C). Druhý z uvedených příkazů lze použít i na webu pro vyčtení textu z nepopsané grafiky.

Rozpoznávání textu přímo z obrazovky bývá chybovější než rozpoznávání grafických či skenovaných dokumentů, protože na obrazovce je text v menším rozlišení. Lepším výsledkům můžeme napomoci maximalizací okna či nastavením vyššího rozlišení obrazovky. V popisu novinek nedávno vydané aktualizace JAWS 2021.2012 lze zjistit, že nám pro získání lepších výsledků přibyla ještě jedna možnost. Při rozpoznávání obrazovky může prý lepší přesnosti dosáhnout OCR funkce Microsoftu, která je součástí systému Windows 10. V Centru nastavení JAWS je tedy nově možnost zapnout pro rozpoznávání textu z obrazovky místo knihoven OmniPage právě OCR Microsoftu.

Nastavení OCR

Plynule jsme tedy přešli k tomu, jaké možnosti nám JAWS nabízí, pokud jde o nastavení rozpoznávání textu. I zde je vše velmi jednoduché.

V Centru nastavení JAWS je ve stromovém seznamu voleb větev nazvaná Rozpoznávání textu. V ní je několik možností vztahujících se k OCR.

Jednak je tu primární a sekundární jazyk rozpoznávání. Primární jazyk by měl být nastaven dle hlavního jazyka dokumentů, které rozpoznáváme. Pokud je dokument dvojjazyčný, měl by sekundární jazyk odpovídat druhému jazyku dokumentu. Ve výchozím stavu jsou tyto volby nastaveny na češtinu a angličtinu.

Dále zde najdeme již zmíněnou možnost „Používat pro rozpoznávání textu služby Microsoftu“, která zajistí, že pro analýzu textu z obrazovky se využije systémová OCR služba Windows 10 a dále možnost „Jazyk rozpoznávání pro služby Microsoftu“, s jejíž pomocí si nastavíme, pro jaký jazyk chceme systémovou OCR službu používat.

Závěr

JAWS nabízí rozpoznávání textu, které sice obsahuje méně možností a možná i trochu nižší přesnost než specializované OCR programy. Zato je ale rychle při ruce na stisk jednoho skupinového příkazu. Hodit se mohou i některé funkce, které naopak v samostatné OCR aplikaci nenajdeme, jako je zpřístupnění původně neovladatelného okna v aplikaci nebo hlášení orientace stránky ve skeneru. Rozhodně jde tedy o užitečný nástroj, který se vyplatí používat.

Přehled klávesových zkratek pro rozpoznávání textu

Všechny funkce rozpoznávání textu jsou dostupné přes skupinový příkaz, který zahájíme stiskem posloupnosti kláves JAWSKey + mezerník, O. Příkaz potom dokončíme jednou z následujících kláves:

  • F – rozpoznání vybraného grafického souboru v Průzkumníku a otevření textu v Prohlížeči výsledků.
  • R – rozpoznání vybraného grafického souboru v Průzkumníku a otevření textu ve Wordu.
  • D – rozpoznání otevřeného grafického PDF v Adobe Readeru a otevření textu v Prohlížeči výsledků.
  • A – naskenování tištěné předlohy a otevření textu v Prohlížeči výsledků.
  • W – rozpoznání textu aktuálního okna a přepnutí do JAWS kurzoru pro prohlížení textu v okně.
  • C – rozpoznání aktuálního prvku a přepnutí do JAWS kurzoru pro prohlížení textu v prvku.
  • S – rozpoznání textu na celé obrazovce a přepnutí do JAWS kurzoru pro jeho prohlížení.
  • Q – ukončení právě probíhajícího rozpoznávání.
  • Shift + pomlčka (na české klávesnici) – zobrazení nápovědy kláves ke skupinovému příkazu pro rozpoznávání textu.

Autor: Jan Šnyrych

Tento článek byl se souhlasem redakce přejat z archivu Téčka – technické přílohy časopisu Zora. Pokud máte zájem o aktuální zprávy, recenze, návody a další texty o technologiích pro zrakově postižené, zajistěte si předplatné Téčka, které je dostupné už od symbolických 75 Kč za rok.