hunspell(1) General Commands Manual hunspell(1) NEV hunspell - unicode-os helyesiras-ellenorzo, szotovezo es morfologiai elemzo program ATTEKINTES hunspell [-1aDGHhLlmnOstvwX] [--check-url] [--check-apostrophe] [--help] [-i karakterkodolas] [-d szotar[,...]] [-p sajatszotar] [szoveges/OpenDocument/TeX/LaTeX/HTML/SGML/XML/nroff/troff allomany(ok)] LEIRAS A hunspell felismeri es javitja az eluteseket es tipushibakat egyszeru szoveges, OpenDocument, (La)TeX, XML, HTML es groff (kezikonyv oldal) allomanyokban. Ha nem adunk meg allomanynev-parametert, a Hunspell az Ispell csofeluletehez hasonloan mukodik: a bemenet sorait szavakra bontja, es *, +, vagy - jellel kezdodo kimeneti sorral jelzi, ha egy szo jo, es # vagy & jellel, ha rossz. A csofelulet parancsait viszont az Ispellhez hasonloan csak a -a kapcsolo megadasaval ertelmezi. Allomanynev parameter eseten elindul egy az Ispellehez hasonlo interaktiv felulet. KAPCSOLOK -1 Specialis formatum: a bemeneti allomany tabulatorjelet tartalmazo soraibol csak az elso tabulatorjel elotti karaktersorozatot vizsgalja meg. -a Ispellhez csofelulet. A !, +, -, @, #, vagy ^ jellel kezdodo sorok a csofelulet parancsai, jelentesuket az Ispell kezikonyvoldal reszletezi. A -a kapcsolo hatasara a kimenetben a jo szavakat csak csillaggal jelzi a Hunspell. Ez nagyobb kompatibilitast biztosit az Ispellt hasznalo programok nemelyikevel (peldaul a LyX-szel). Ekkor nem kell megadnunk a -a kapcsolot, mivel az Ispellt hasznalo programok automatikusan ezzel a kapcsoloval inditjak el az Ispell neveben futo Hunspellt is. -d szotar[,szotar2,...] Beallitja a helyesirasi szotarakat a kiterjesztes nelkuli szotarnevek, utvonalak megadasaval. Peldaul a hunspell -d hu_HU,hu_geo,hu_med,de_DE,de_med a magyar alapszotarat es kiegeszito szotarait, valamint nemet alapszotarat es annak egy kiegeszito szotarat tolti be. Az alapszotarak egy aff es egy dic kiterjesztesu allomanybol allnak, a kiegeszito szotarak csak dic allomanybol. A kiegeszito szotarak nevere vonatkozoan nincs szabaly (csak a dic kiterjesztes), a szotarnevek sorrendje hatarozza meg, hogy melyik alapszotarhoz toltodnek be a kiegeszito szotarak (ami pedig meghatarozza a javaslattevest). Az elso szotar mindig alapszotar. Az alapertelmezett szotar a kornyezet nyelvi beallitasatol fugg az Unix rendszereken. Locale hianyaban a /usr/share/hunspell/default az alapertelmezett szotar. A megadott utvonal lehet abszolut es relativ is. Relativ utvonal eseten eloszor az aktualis, majd a /usr/share/hunspell es meg tobb mas konyvtarban keresi a szotart a program. L. -D es a PELDAK. -D A keresesi utvonalak, az elerheto es betoltott szotarak utvonalanak kijelzese. -G A -l, -w, es -L kapcsolokat kiegeszito kapcsolo. A standard bemenetrol erkezo hibas szavak, illetve sorok megjelenitese helyett a jo szavak es a hibatlan sorok megjeleniteset kerhetjuk vele. Ha mast nem adunk meg, a -l kapcsolo hatasanak megfeleloen mukodik, csak a rossz helyett a jo szavakat irja a standard kimenetre. -h, --help A beepitett leiras megjelenitese. -H HTML bemeneti allomanyformatum beallitasa. Ha az allomany nevenek .html vagy .htm a kiterjesztese, ez automatikusan bekovetkezik. -l Kiirja a hibas szavakat a standard bemenetrol erkezo allomanybol. Hasznalhato a -H, -t, -n, -1 kapcsolokkal egyutt is. A -G kapcsolo megforditja a Hunspell mukodeset: csak a jo szavak kerulnek kiirasra. -L Csak a hibas szavakat tartalmazo sorokat irja ki a standard bemenetrol erkezo allomanybol. Hasznalhato a -H, -t, -n, -1 kapcsolokkal egyutt is. A -G kapcsolo megforditja a mukodeset: csak azok a sorok kerulnek kiirasra, amelyek egy hibas szot sem tartalmaznak. -m Elemzo uzemmod: a bemeneti szovegszavak morfologia elemzese, illetve a szotari morfologiai leiras hianyaban a toldalekolt szavak kapcsoloinak kijelzese (szotarfejlesztoknek). -n Nroff/troff bemeneti allomanyformatum beallitasa, elsosorban a kezikonyvlapok ellenorzesere. -O OpenDocument (ODF vagy flat ODF) bemeneti allomanyformatum beallitasa. Ha az allomany nevenek .odt, .ods, .odp, .odg, illetve ezek sablon (.ott, ...) vagy flat (.fodt, ...) valtozatainak megfelelo a kiterjesztese, ez automatikusan bekovetkezik. Ha meg nem volna, telepitsuk az unzip programot a kapcsolo hasznalata elott. -p sajat_szotar A felhasznalo sajat szotaranak beallitasara szolgal. Az alapertelmezett sajat szotar a $HOME/.hunspell_default allomany. Ha szotarat is megadunk a -d kapcsoloval, vagy a DICTIONARY kornyezeti valtozoval, a sajat szotar a $HOME/.hunspell_szotarnev lesz. Ha a sajat szotar nem letezik, letrehozza. Ha az aktualis konyvtarban is van egy ugyanilyen nevu allomany, akkor annak tartalma is beolvasasra kerul, mint sajat szotar, es az ujonnan felvett szavak is ide kerulnek. A -p , vagy a WORDLIST kornyezeti valtozo megadasaval uj sajat szotarat jelolunk ki. A sajat szotarat az aktualis konyvtarban, es a sajat konyvtar gyokereben ($HOME) keresi a Hunspell. Ha nem talalhato, akkor az ujonnan felvett szavak mentesenel letrehozza a sajat konyvtar gyokereben. -s Tovezo uzemmod: a bemeno szovegszavak tovezese (a szotartol fuggo pontossaggal). -t LaTeX bemeneti allomanyformatum beallitasa. Ha az allomany nevenek .tex a kiterjesztese, ez automatikusan bekovetkezik. -u Tipikus hibak kijelzese az allomanybol, cserejavaslattal. -u2 Tipikus hibak es javitasuk kijelzese modosithato, es a sed programmal vegrehajtathato formaban. Iranyitsuk a Hunspell kimenetet egy allomanyba. Toruljuk azokat a sorokat az elmentett allomanybol, amelyek sed paranccsal megadott javitasat nem szeretnenk. Mentsuk el az allomanyt, es a sed -f javitas eredeti_allomany >javitott_allomany paranccsal javithatjuk az allomanyt gyorsan es egyszeruen. (A sok hibat tartalmazo allomanyok javitasat gyorsitja meg ez a lehetoseg.) -U Ha az -u kapcsoloval kapott javaslatokat mind el szeretnenk fogadni, akkor az -U kapcsoloval a Hunspell automatikusan vegrehajtja a csereket, es a modositott allomanyt a szabvanyos kimenetre kuldi. Pelda a javitasra: hunspell -U eredeti_allomany >javitott_allomany. A hibakimeneten megjelennek a javitasok is meg egyszer, a - kapcsolohoz hasonlo modon. -v Verzioszam. -vv Verzioszam (Ispell kompatibilitas miatt). -w Csak a hibas szavakat irja ki a standard bemenetrol erkezo, soronkent egy szot tartalmazo allomanybol. A sorok nincsenek szavakra bontva. A sorok szavakra bontasa, es csak a hibas szavak kiirasa a -w kapcsoloval erheto el. A -G kapcsolo megforditja a Hunspell mukodeset: csak a jo szavak kerulnek kiirasra. -X XML bemeneti allomanyformatum beallitasa. Ha az allomany nevenek .xml a kiterjesztese, ez automatikusan bekovetkezik. INTERAKTIV FELULET A felulet legfelso soraban a hibas szoalakot, es az eppen vizsgalt allomany nevet latjuk. Amennyiben egy szoalak szotari tiltas miatt nem kerul elfogadasra, a bal felso sarokban a TILTOTT! (FORBIDDEN!) uzenet is megjelenik. Ez az uzenet arra utal, hogy nem hianyos szokincs, hanem szandekos tiltas miatt nem kerult a szo elfogadasra. Az elso sor alatt az allomany hibas szot tartalmazo sorat, es szovegkornyezetet lathatjuk, majd ezt kovetik a javaslatok, ha vannak. A hasznalhato billentyukombinaciok: Szokoz Tovabblepes javitas nelkul a kovetkezo hibas szora. Szamok A megfelelo javaslat kivalasztasa. c Csere. A hibas szo csereje a megadott szora, vagy szavakra. Az Escape billentyu ketszeri lenyomasaval megszakithatjuk a a cseret. j A szo elfogadasa a program futasanak befejezodeseig. f A szo felvetele a sajat szotarba. k A szo kisbetuskent valo felvetele a sajat szotarba. t Ragozott toszo felvetele. A ragozas a masodikkent megadott, mintaul szolgalo szo alapjan tortenik. Ha ez a szo nincs felveve a szotarba, a toszofelvetelt elolrol kell kezdeni. Pelda: gyakran hianyoznak az idegen es a mozaikszavak. Vegyuk fel a hianyzo OTP szot a tv koznevi mozaikszo toldalekaival! Lenyomjuk a t billentyut, beirjuk, hogy OTP, leutjuk az uj sor billentyut, beirjuk, hogy tv, es ismet uj sor. A tv szo ugyanis mar szerepel a szotarban, es ragozasa mondja meg a programnak, hogy az OTP szot milyen toldalekokkal szeretnenk latni, pl. OTP-hez, OTP-met stb. a tv-hez, tv-met mintajara. A -val/-vel, -va/-ve toldalekokat a kotojellel kapcsolt toldaleku szavak eseteben kulon kell felvenni, de meg igy is sokkal kenyelmesebb a specialis tofelvetel, mint minden (akar tobb szaz) toldalekos alakot kulon-kulon felvenni. Egy kis segitseg a minta kivalasztasahoz: elso menetben a hangrend szamit. Pl. mozaikszavaknal a mely hangrendu uj szavak felvetelenel hasznalhatjuk a MAV szot peldakent, ajakreses magas hangrendnel pedig az emlitett tv-t. Ajakkerekiteses magas hangrend eseteben a HOK szot hasznalhatjuk (amig at nem lesz javitva a helyes hok-re). Ha a hianyzo szo nem mozaikszo, hanem peldaul tulajdonnev, a Pal, Peter, Ors szavakat adhatjuk meg peldanak a hangrendtol fuggoen. Ha meg egyszeru koznevrol van szo, akkor hasznaljuk az ok, ek, uk szavakat. Igeknel all, vel, ul, ikes igeknel azik, verzik, nozik lehet a pelda (remelhetoleg a kovetkezo valtozatokban egyszerusodik ez a tofelvetel). Az Escape billentyu ketszeri lenyomasaval megszakithatjuk ezt a muveletet. Az itt felvett szavak automatikusan a sajat szotarba kerulnek. Ha ezt innen torolni szeretnenk, a programbol kilepve a sajat szotar kezi atszerkesztesevel tehetjuk meg. m Kilepes a valtoztatasok mentese nelkul. A program valtoztatas meglete eseten megerositest ker. v Az allomany ellenorzesenek megszakitasa a valtoztatasok mentesevel. Ha van kovetkezo allomany, akkor a program annak ellenorzeset kezdi el. ? Segitseg. Hasonlo rovid leiras megjelenitese a billentyuparancsokrol. CSOFELULET A Hunspell soronkent dolgozza fel az allomanyokat, a helyes szavakat * (toszo), - (osszetett szo), vagy + (ragozott szo) karakterrel jeloli, a helyteleneket # (nincs javaslat) , vagy & (van javaslat) karakterrel. A + jelet a kimenetben koveti meg a szoto. A # jel utan a hibas szo, es kezdopozicioja van feltuntetve. A & jelet koveti a hibas szo; a javaslatok szama; a hibas szo kezdopozicioja; majd kettospont utan a javaslatok, vesszovel elvalasztva: macska * macskabajusz - macskak + macska mcsk # mcsk 0 macka & macka 7 0: macska, maca, racka, packa, vacka, marka, macko PELDAK hunspell -d en_US english.html Az amerikai angol helyesirasi szotar kivalasztasa (aktualis, vagy a /usr/share/hunspell konyvtarbol. hunspell -l szoveg.html A megadott allomany hibas szavainak kiirasa. hunspell -l *.odt | sort | uniq >nem_ismert_szavak Az aktualis konyvtarban talalhato osszes OpenDocument szoveges allomany nem ismert szavainak allomanyba mentese (az ismetlodok kiszuresevel). hunspell -p nem_ismert_szavak_de_jok *.odt Az aktualis konyvtarban talalhato OpenDocument szoveges allomanyok interaktiv ellenorzese sajat szotar megadasaval. A peldaban szereplo sajat szotar nem mas, mint az elozoleg elmentett nem_ismert_szavak allomanya, amelyekbol kivettuk azokat a szavakat, amelyeket most javitani szeretnenk. KORNYEZET DICTIONARY A szotar helyenek megadasara szolgal. Szerepe megegyezik a -d kapcsoloval. DICPATH A szotarkeresesi utvonalat tartalmazo valtozo. WORDLIST A sajat szotar helyenek megadasara szolgal. Szerepe megegyezik a -p kapcsoloval. ALLOMANYOK /usr/share/default.aff Az alapertelmezett ragozasi tablazat. Lasd hunspell(4). /usr/share/default.dic Az alapertelmezett szotar az elozo ragozasi tablazathoz. Lasd hunspell(4). $HOME/.hunspell_default Az alapertelmezett sajat szotar. Az allomanyt letrehozza a Hunspell, ha nem letezik. Lasd ispell(1). LASD MEG hunspell (4), hunstem (1), makedb (1), lookdb (1), ispell (1), ispell (4), Magyar Ispell dokumentacio. ELONYOK A program a kovetkezo elonyoket nyujtja a hasonlo celokat szolgalo Ispell-lel szemben: - Kepzok atfogo ismerete. (Tobb tizezer helyes szoalak elfogadasat tette lehetove a tesztelesre hasznalt 4 millio szavas gyakorisagi szotarban.) - Homonimak kezelese (nincsenek peldaul olyan alakok elfogadva, mint megvarban). - Helyes javaslatok a tobb karakter valtozasaval jaro tipikus hibakra (j/ly, ij/ijj, nyj/nny es meg tobb tucatnyi tevesztes megvizsgalasaval). Az Ispell csak ket karakter felcserelese; vagy egy karakter hianya, csereje, illetve felesleges jelenlete eseten ad helyes javaslatot. - Az osszes helyes osszetett szonak latszo, de tipikus hibaval eloallo alak tiltasa (karvaj, szintu, sulyto stb.) - Javaslatok valoszinusegi sorrendben jelennek meg (tipikus hibak, i/i, o/o, u/u tevesztesek stb.). - Osszetett szavak eseten 6-3-as szabaly alkalmazasa (helyesiras-ellenorzo, gepkocsi-osszeszereles). - Mozgoszabaly alkalmazasa (kiviteli engedely, kiviteliengedely-keres). - A magyar nyelv egyeb osszeteteli szabalyainak alkalmazasa (peldaul hatlovetu, tizenket lovetu, kethavi, ket honapos, masodmagaval). - Leg-, legesleg- es -bb confixum helyes kezelese (nincs pl. legedes, csak legedesebb). - Ragozhato toszofelvetel. Megkonnyiti egy uj szo ragozott valtozatainak ellenorzeset, feleslegesse teve ezek kulon-kulon torteno felvetelet a sajat szotarba. - Javaslatok massalhangzo-triplazasok (sakkkor, baletttancos, dzsesszszak) eseten. (Ispell helyesnek fogadja el ezeket.) - Javaslatok szotagduplazasok (oktatatas, igenenevet) eseten. - Javaslatok ekezet nelkuli szovegre (tukorfurogep->tukorfurogep). - Kotojeles szavak kezelese (unos-untalan). - Toldalekolt szamok (1-jen, 11-en, 5.-et) kezelese. - , %, es
jelek (%-kal) toldalekolt alakjainak kezelese. - Mozaikszavak (MAV-osokat) kezelese. - Y-ra vegzodo szavak (boyjal, pennyvel) kezelese. - Idegen ejtesu szotagra vegzodo szavak (Anonymusszal, Voltaire-nek) kezelese. - Ket szobol allo foldrajzi nevek (San Francisco-i) kezelese. - Hibas alakok tiltasa (Babitssal, tanit, alkotomuvesz stb.) - Tiltasok jelzese a felhasznaloi feluleten. - Egyeb (peldaul az Ispell ragozott utoszo eseteben barmilyen szoosszetetelt elfogad: macskatekerem, kutyakavarom, ezt a Hunspell nem teszi meg). - Magyar nyelvu (illetve locale (7) fuggo) felulet. - Hordozhato szoveges szotarallomanyok, szemben az Ispell platform, es binaris Ispell forditastol fuggoen (nem) kezelheto adatallomanyaival. SZERZO A Hunspell az OpenOffice.org MySpell fuggvenykonyvtaran tovabbfejlesztese. A MySpell affixumtomoritesenek mintaja az International Ispell program volt. A mintakent szolgalo International Ispell szerzoje Geoff Kuenning, sok mas elodje munkajara tamaszkodva (l. ispell(1)). A Myspellt Kevin Hendricks keszitette a legjelentosebb nyilt forraskodu irodai csomaghoz, az OpenOffice.org-hoz 2001-2002-ben (l. http://hu.openoffice.org). A Hunspell programkonyvtarat es parancssori programot Nemeth Laszlo keszitette 2002-2008-ban. 2014. majus 27. hunspell(1)