Keresés

Részletes keresés

Kis Ádám Creative Commons License 2005-05-07 20:02:24 191

Kedves Gábor!

 

A helyesírás-ellenőrzést voltál szíves elhibázni.

 

Amúgy több ponton vitatni lehet az írtakat.

 

Az első vitatható dolog a konkrét eset komoly problémának tekintése. Az előző hozzászólásomból kiderült, hogy se nem komoly, se nem komolytalan - az 'ének' egyszerűen alkalmatlan példa.

 

A második vitatható dolog, hogy a szótagolóprogram helyesírás-ellenőrzést végez. Ez azt a látszatot kelti, mintha a szótagokra való bontásnak köze lenne a helyesíráshoz - úgy általában. Ez azonban nem igaz.

 

A helyesírás-ellenőrzés (egy része, melynek egyáltalán köze van a szótagoláshoz) pozitív mintával való hasonlításos eljárás. A program azt próbálja megállapítani, hogy a szövegszó (amely adott eseteben két szóközzel vagy szóközzel és írásjellel, bekezdésjellel stb. határolt karaktersorozat) megegyezik-e az előre tárolt alakok valamelyikével. Ha igen, nem tes semmit, ha nem, akkor jelez.

 

Ennek önmagában semmi köze nincs a helyesíráshoz. Az így  "hibás"-nak  (ezt a szót rendes spell checker nem ejti ki aí képernyőjén!) jelölt alak lehet helyes, és olya alak, amelyet a program nyugodt lélekkel átlép, mert helyesnek ítéli, hibás.

 

Kedvenc példám: "Az edző ellőtt elsőtétült a világ a felelőtlenül előtt labdák miatt". A mondatban két hibás szó minimálisan van, a program viszont nem fog jelezni egyet sem, és még a kiritkus zsenik sem tudják elérni (no, nem ezt a konkrét esetet, hanem az elvet).

 

Más részről ezt a klasszikus verssort "Orrán feszítve fel s alá lépked az orrobém" hibásnak fogja jelezni, pusztán azért, mert az orrobémről ő sem tud, nemcsak a Brehm, a Mayer s a Révai. ("Lantomból a nap s az ájer épp e percben csalta ki" - írta Ch. Morgenstern, illetve Szabó Lőrinc).

 

Más kérdés, hogy a helyesírás-ellenőrzésnek nem is elegendő a szótagolás, ennél többre is szüksége van, az úgynevezett stemmerre (a kutya esetében a ku-tya tagolás irreleváns, ennél fontosabb a kuty-a, illetve kuty-á, ami ugye, a szótagolóval nem is produkálható.)

 

Tovább menve, ha ezt a hibakört akarjuk géppel ellenőrizni, felemás a helyzetünk, ugyanis a gép csak azt tudja megállapítani, hogy valamit tévesen egyebírtunk, azt sokkal kevésbé, ha valamit különírással hibázunk el. Ez alapvetően a helyesírási szó fogalmával függ össze. A hibás különírás minimum 3 szóközt feltételez.

 

Az sem igazá üdvöz, hogy a magyarban elvileg bármilye két főnév egybeírható (jelentésfüggetlenül).

 

Kis Ádám

DJG Creative Commons License 2005-05-07 19:00:24 188
Na puff neki, a hely szelleme, valahol kihagytam egy kötôjelet, nem árulom el, hol, talán nem találjátok meg, bár amúgy biztosan...

Üdv,
Gábor
A hozzászólás:
DJG Creative Commons License 2005-05-07 18:58:48 187
Továbbra sem érzem, hogy az ének az automatikus elválasztás szempontjából komoly probléma lenne.

Nem jó kifejezés erre a komoly probléma, nem feltétlenül az, de mindenképpen speciális eset, megoldandó feladat: valami, amire ha nem fordítasz külön figyelmet, magától nem lesz jó. Van még sok ilyen amúgy, egy tucatnyi biztosan.

Amit az egybeírásról-különírásról írtatok, az nem feltétlenül jó érv egy szótagolóprogramnak. A szótagolómodul bizonyos mértékig helyesírásellenôrzést is végez, de nem teljes mértékig (például, nem tisztje ismeretlenként visszautasítani a 'városak' szót, mondván, hogy az nem jó, hanem 'városok' a helyes: ez, legalábbis az én véleményem szerint, és az enyém eszerint is mûködik, nem a szótagoló feladata — neki helyesen kell elválasztania a (felismerhetôen) rosszul megalkotott szavakat is. Ezen megengedôbb álláspont miatt nem építhet az elemzés ennyire szigorúan a helyesírás eme szabályaira.

Arról már nem is beszélve — persze, ezért fájjon a programozó feje —, hogy ez katasztrófálisan nehezen követhetô és karbantartható programhoz vezetne. Az algoritmikus megközelítés alapvetô jellege, hogy szabályos, rendszerezett fogalmakkal dolgozik, márpedig ha van területe a nyelvnek, ahol nincs könnyen kezelhetô rend és szabály, az az egybeírás-különírás; hol is lenne ez nyilvánvalóbb, mint éppen ebben a topikban? :-))

Üdv,
Gábor
Előzmény:
Kis Ádám Creative Commons License 2005-05-07 17:50:53 181

Bocs Tecs!

 

Valaki valamit nem ért. Biztos én.

 

Szerintem melegének, hidegének, öregének, betegének, kerekének, örökének mint összetétételek általában külön írandók.

 

Az ősének vitatható határeset, viszont az elválasztás tekintetében indifferens, mert az ő után semmiképp nem lehet elválasztani.

 

A hősének,  regösének bevehető a szirénének mellé, de ezek sem valami nagyon gyakori szavak, úgy érzem.

 

A hősénekből 921 vana a gugliban, de ezekenek a nagyobb része érzáésem szerint a hős ragozott alakja, a regösénekből van vagy 120, ezek meg talán valamennyien az összetett szó előfordulásai.

 

Továbbra sem érzem, hogy az ének az automatikus elválasztás szempontjából komoly probléma lenne.

 

Kis Ádám

 

 

 

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!