Popis fungování kontroly pravopisu a dostupné slovníky k programu The Bat! v4

30.3.2009 | Marek Mikuš


Program The Bat! podporuje ve 4. generaci více systémů pro kontrolu pravopisu a navíc je umožňuje používat zaráz a zároveň je možné mít aktivních více jazyků a slovníků, toto je velmi praktické pro uživatele píšící v různých jazycích a různým způsobem (s diakritikou u komerčních aktivit a bez diakritiky do konferencí a fór apod.).

Zde je popis jednotlivých systémů a jejich možnosti použití:

Systém SSCE (Sentry Spelling-Checker Engine)

Popis tohoto systému je k dispozici ve Znalostní databázi. Systém SSCE nabízí mnoho možností nastavení, v editoru jsou dostupné v menu Pravopis | Nastavení kontroly. Pro tento systém jsme připravili dva české slovníky, první s diakritikou (862 tis. slov) a druhý obsahující stejná slova, ale kompletně bez diakritiky (814 tis. slov) - je tedy vhodný pro uživatele, kteří jsou zvyklí psát bez diakritiky a standardní slovníky hlásí u těchto slov chybu. Ke stažení jsou včetně instalačního programu na stránce Stažení. Podpora slovenštiny zatím není u tohoto systému dostupná.

Slovníky pro systém SSCE jsou uloženy v binárních souborech s příponami *.CLX (vlastní slovník, česká verze s diakritikou je v souboru sscecs2.clx, česká bez diakritiky v souboru sscecs3.clx) a *.TLX (uživatelský slovník, česká verze je v souboru sscecs.tlx)a je potřeba, aby byly uloženy v podsložce Speller ve složce programu The Bat! na disku (např. C:\Program Files\The Bat!\Speller) - pokud nainstalujete slovníky pomocí instalačního programu a zvolíte správnou cestu ke složce, kde je program The Bat! nainstalován, po spuštění budou připraveny k použití a vybrané jazyky budou zobrazeny na stavovém řádku editoru.

Systém HUNSPELL (pokračovatel systému MYSPELL)

Slovníky tohoto typu jsou používané v mnoha programech, např. OpenOffice.org nebo Firefox. Tento systém nenabízí žádné speciální nastavení jako je to u systému SSCE a nenabízí ani slovník bez diakritiky, na druhou stranu jsou k dispozici pro češtinu, slovenštinu a dalších 90 jazyků - ke stažení jsou např. na webu OpenOffice.org (přímý odkaz na český slovník je zde). Slovenský slovník je dlouhodobě udržovanější a jeho tvůrci mají vlastní webový portál zde.

Slovníky pro systém HUNSPELL jsou uloženy v textových souborech s příponami *.DIC (vlastní slovník, česká verze je v souboru cs_CZ.dic, slovenská v souboru sk_SK.dic) a *.AFF (definiční soubor, česká verze je v souboru cs_CZ.aff, slovenská v souboru sk_SK.aff) a je potřeba, aby byly uloženy v podsložce Dictionaries ve složce programu The Bat! na disku (např. C:\Program Files\The Bat!\Dictionaries) - tato složka je vytvářena automaticky a již některé jazyky obsahuje po instalaci programu, stačí do ní soubory DIC a AFF zvoleného jazyka nakopírovat a restartovat program, po spuštění budou připraveny k použití.

Pro české uživatele je z hlediska velikosti slovníků a možnostem nastavení výhodnější systém SSCE, slovenští uživatelé mají zatím možnost omezenou pouze na systém HUNSPELL.

Nastavení kontroly v editoru

V editoru je možné aktivovat požadovaný jazyk v menu Pravopis | Jazyk a pro automatické kontrolování zapnout volbu Pravopis | Kontrolovat automaticky. Klávesová zkratka přiřazená tomuto povelu je Ctrl+F4. Kontrolu pouze aktuálně editované zprávy provedete výběrem volby Pravopis | Zkontrolovat nyní nebo stiskem klávesy F4. Jestliže kliknete pravým tlačítkem myši na zvýrazněném slovu, zobrazí se návrhy pro změnu slova, volbou Přidat se vloží příslušné slovo do Vlastního slovníku uvedeného v závorce. Volba Přeskakovat znamená, že Vás již program nebude na toto slovo v aktuálně editované zprávě upozorňovat.

U slovníků SSCE jsou dostupné pokročilé možnosti nastavení kontroly, jako např. ignorování slov psaných velkými písmeny, slov obsahujících číslice atd., toto nastavení je v menu Pravopis | Nastavení kontroly.

Nastavení slovníků v šabloně pomocí makra

V šabloně lze definovat jaký jazyk bude pro kontrolu pravopisu používán, a to pomocí makra %LANGUAGE="ID jazyka", pro nastavení obou českých slovníků s diakritikou a bez diakritiky by makro vypadalo takto %LANGUAGE="CS CS_WNC", společně se slovenštinou by to bylo %LANGUAGE="CS CS_WNC SK" atd.

Zpět na články »