Téčko: Tipy a triky pro JAWS - Smart Picture

V letošním ročníku časopisu Téčko vychází seriál, ve kterém hrají hlavní roli zajímavé a užitečné funkce z široké škály toho, co nám nabízí odečítač JAWS. Předplatitelé Téčka mají tipy a triky pro JAWS takříkajíc z první ruky, nicméně s časovou prodlevou se budou v měsíčních intervalech popisy nejrůznějších možností JAWSu objevovat i na webu Tyflokabinetu SONS.

První z „vychytávek“ JAWSu, kterou si v tomto seriálu představíme, je funkce Picture Smart. Ta nám umožňuje nechat si rozpoznat obsah jakéhokoli obrázku a přečíst si jeho slovní popis. Na rozdíl od funkce OCR, která je zaměřena pouze na rozpoznávání tištěného textu, Picture Smart můžeme použít k získání popisu grafiky, obrázků a fotografií a v jisté míře i rukou psaného textu.

Jak to funguje?

Jak uvidíme níže, Picture Smart můžeme povolat k rozpoznání jakéhokoli grafického souboru, grafického prvku v aplikaci či na webu a také naskenovaného obrázku. Rozpoznávání neprobíhá na rozdíl od OCR přímo v počítači, ale grafika je odeslána na internetový server, který ji analyzuje a vrátí textové popisky. Ty nám nakonec JAWS zobrazí a přečte. K využívání Picture Smart tedy potřebujeme internetové připojení. Výsledek navíc nemáme k dispozici okamžitě, ale zpracování vždy několik sekund trvá.

JAWS 2019 a 2020 k rozpoznávání obrázků využívá cloudovou službu Microsoftu. Pokud si nainstalujeme veřejnou beta verzi českého JAWSu 2021, budeme mít k dispozici vylepšenou funkci Picture Smart, která může pro přesnější výsledky kromě analýzy obrazu serverem Microsoftu využít ještě obdobnou službu Googlu. JAWS 2019 a 2020 neměl navíc zabudované překládání popisu obrázku do češtiny, takže to bylo řešeno jen dodatečným českým skriptem. V JAWSu 2021 by český překlad měl být již spolehlivější, protože je už interní funkcí odečítače.

Jak na to?

Dejme tomu, že nám mailem přišlo novoroční přání, které je v grafickém souboru GIF. Uložíme je z přílohy zprávy do souboru na disk. Když potom budeme chtít rozpoznat, co v souboru je, budeme postupovat takto:

  1. V Průzkumníku Windows vybereme požadovaný soubor.
  2. Klávesami JAWSKey + mezerník vstoupíme do režimu skupinového příkazu a písmenem P přejdeme do skupiny příkazů pro funkci Picture Smart.
  3. V této skupině stiskem klávesy F spustíme Picture Smart pro právě vybraný soubor.
  4. Během několika sekund se nám zobrazí prohlížeč výsledků, a v něm si budeme moci přečíst popis obsahu obrázku.

JAWS 2021 provede základní analýzu obsahu obrázku, která u náhodně vybrané novoročenky z mé mailové schránky dopadla s následujícím výsledkem:

„Popisek je Text.

Tato značka popisuje fotku: text.

Fotku pravděpodobně popisují tyto značky: jeskyně, návrh.“

Pokud nám tento popis obrázku nebude dostačovat, což je dosti pravděpodobné, můžeme v prohlížeči výsledků využít na konci popisu odkaz „Více výsledků“. Proběhne podrobnější analýza obrázku za využití online služeb Microsoftu i Googlu a výsledkem bude opět otevřený prohlížeč výsledků s následujícím textem:

„Popisek je Text.

Na fotce je pravděpodobně toto logo: Mulberry.

Na fotce je tento text: PF 2021; Veselé Vánoce a šťastný nový rok; Úřad vlády České republiky; Autorkou obrázku je dvanáctiletá Vanesa z Dětskeho domova Hodonin, jejiž výkres ziskal nejvice hlasi ve vanoční vytvarne soutéži Vánoční betlém..

Na fotce je pravděpodobně tento objekt: Malba.

Na fotce je možná tento objekt: Náušnice.

Tato značka popisuje fotku: text.

Fotku pravděpodobně popisují tyto značky: design, jeskyně, tunel.“

Je tedy vidět, že podrobnější rozpoznávání obsahu obrázku nám už přineslo poměrně přesné výsledky, alespoň pokud jde o rozpoznání textu na přání, který je vyveden ozdobným fontem, jenž by pro klasické OCR představoval problém. Obrázek byl rozeznán o něco hůřeKlene se na něm opravdu oblouk v němž září světlo, ve kterém jsou vidět siluety svaté rodiny.

Pokud bychom v JAWSu 2021 chtěli rovnou využívat důkladnější způsob rozpoznání, stačí ve výše uvedeném skupinovém příkazu k poslední klávese přidat Shift, stiskli bychom tedy postupně JAWSKey + mezerník, P, Shift + F a dostali bychom se přímo k detailnějšímu popisu novoročního přání.

Ve skupině příkazů máme k dispozici i další možnosti. Pokud tedy stiskneme sekvenci JAWSKey + mezerník a dále P, můžeme příkaz završit těmito klávesami:

  • F: Rozpoznání vybraného souboru v Průzkumníku (už jsme si popsali).
  • B: Rozpoznání obrázku ve schránce.
  • C: Rozpoznání grafického prvku, na kterém se nachází právě aktivní kurzor (PC kurzor, JAWS kurzor nebo Virtuální kurzor). Tuto možnost lze v JAWSu 2021 využít i pro rozpoznávání grafiky na webu, která nemá textový popisek. Budeme-li mít v Adobe Readeru otevřený PDF dokument, který je tvořen jen naskenovaným obrázkem, můžeme takto rozpoznat i jeho obsah. Zde nám většinou pomůže i klasické OCR JAWSu, ale Picture Smart může mít někdy o něco lepší výsledky. Je tedy dobré vědět, že jej pro PDF můžeme takto použít.
  • A: Rozpoznání naskenovaného obrázku. Zobrazí se skenovací dialog JAWSu, ve kterém máme předvybraný výchozí skener a Enterem z něj můžeme naskenovat jakýkoli dokument k rozpoznání. Případně můžeme v dialogu výchozí skener a další možnosti před zahájením skenování upravit.

Všechny výše popsané klávesy můžeme ve skupinovém příkazu použít bez Shiftu pro základní rozpoznání nebo s Shiftem pro podrobné rozpoznání.

Aby byla informace k Picture Smart kompletní, doplňme ještě, že v JAWSu 2021 přibyla v Centru nastavení volba „Jazyk Picture Smart“. Jejím prostřednictvím bychom si případně mohli místo češtiny vybrat jiný jazyk, do kterého chceme výsledky rozpoznávání obrázků překládat.

Závěr

Picture Smart je praktickou doprovodnou funkcí odečítače JAWS. Oproti OCR je sice pomalejší a jeho funkčnost závisí na internetovém připojení, je ale univerzálnější co do způsobů použití – kromě tištěného textu rozpoznává i grafiku a částečně i rukou psaný text. V novinkách JAWSu je sice uvedeno, že současná implementace možností Picture Smart je pouze experimentální, nicméně i tak se v mnoha situacích může hodit. Kvalita rozpoznávání se navíc může zlepšovat i bez aktualizace JAWSu – stačí, když Microsoft a Google budou zlepšovat své cloudové služby, které si Picture Smart volá. Je tedy dobré o této relativně nové funkci vědět, protože může rozšířit náš arzenál nástrojů pro přístup k původně nepřístupným textům či grafice.

Tento článek byl se souhlasem redakce přejat z archivu Téčka – technické přílohy časopisu Zora. Pokud máte zájem o aktuální zprávy, recenze, návody a další texty o technologiích pro zrakově postižené, zajistěte si předplatné Téčka, které je dostupné už od symbolických 75 Kč za rok.