Keresés

Részletes keresés

DJG Creative Commons License 2005.05.07 0 0 187
Továbbra sem érzem, hogy az ének az automatikus elválasztás szempontjából komoly probléma lenne.

Nem jó kifejezés erre a komoly probléma, nem feltétlenül az, de mindenképpen speciális eset, megoldandó feladat: valami, amire ha nem fordítasz külön figyelmet, magától nem lesz jó. Van még sok ilyen amúgy, egy tucatnyi biztosan.

Amit az egybeírásról-különírásról írtatok, az nem feltétlenül jó érv egy szótagolóprogramnak. A szótagolómodul bizonyos mértékig helyesírásellenôrzést is végez, de nem teljes mértékig (például, nem tisztje ismeretlenként visszautasítani a 'városak' szót, mondván, hogy az nem jó, hanem 'városok' a helyes: ez, legalábbis az én véleményem szerint, és az enyém eszerint is mûködik, nem a szótagoló feladata — neki helyesen kell elválasztania a (felismerhetôen) rosszul megalkotott szavakat is. Ezen megengedôbb álláspont miatt nem építhet az elemzés ennyire szigorúan a helyesírás eme szabályaira.

Arról már nem is beszélve — persze, ezért fájjon a programozó feje —, hogy ez katasztrófálisan nehezen követhetô és karbantartható programhoz vezetne. Az algoritmikus megközelítés alapvetô jellege, hogy szabályos, rendszerezett fogalmakkal dolgozik, márpedig ha van területe a nyelvnek, ahol nincs könnyen kezelhetô rend és szabály, az az egybeírás-különírás; hol is lenne ez nyilvánvalóbb, mint éppen ebben a topikban? :-))

Üdv,
Gábor
Előzmény: Kis Ádám (181)
DJG Creative Commons License 2005.05.07 0 0 186
Ádám,

még egy klasszikus, gyakran idézett példa van, a 'gépelem'. Meg, természetesen, nagyon sok egyéb van, amelyek viszont nem okoznak szótagolási eltérést, tehát mindegy, melyik módon okoskodik a program, a kötôjel ugyanoda kerül, tehát végeredményben mindegy.

Nálam csak a 'megint' és a 'felül' szerepel kezdetben a kivételszótárban, a többit a felhasználó teheti hozzá (lehetne akár több is, ez valahogy így alakult ki, még senki nem panaszkodott miatta).

Az, hogy a szavakat kétséges esetben elsôként inkább összetételnek vagy inkább toldalékolt szónak érdemes-e tekinteni, nem igazán elvi kérdés. Régen volt, amikor a modulomban ezekkel az elemi kérdésekkel foglalkoztam, de nagyon úgy emlékszem, hogy pusztán gyakorlati megfontolás döntött mellette: a végül választott elemzési sorrend lényegesen kevesebb hamis találatot, rossz értelmezést eredményezett, mint a fordítottja tette volna. Persze, egy más algoritmussal mûködô program könnyen juthat pont fordított eredményre.

Viszont az algoritmikus elemzésbe nem illeszkednek jól a statisztikai megfontolások. Ha a két értelmezési lehetôség közül az egyik gyakrabban fordul elô a gyakorlatban, attól még ha az elemzés a másik mellett dönt, akkor amellett dönt. Ezt legfeljebb kivételszótár módjára lehet kezelni, legalábbis az algoritmikus elemzés keretein belül. Az OpenOffice-hoz csinált magyar szótagolás teljesen más koncepcióval mûködik (nem analizál, hanem szintetizál), ott ezeket a kérdéseket másképp lehet megoldani, a statisztikai szempontokat is figyelmbe véve.

Üdv,
Gábor
Előzmény: Kis Ádám (176)
rumci Creative Commons License 2005.05.07 0 0 185
Kedves Kis Ádám!

Van egy olyan könyv, hogy Műszaki helyesírási szótár, a lektorok között Kis Ádámmal, és abban szerepel a táv-adatfeldolgozás, táv-adatfeldolgozó állomás. Ez számomra szemben állni látszik azzal, hogy egybe szeretnéd írni. Vagy mégsem? Én is nyugodtan leírnám azt, hogy szeretném, ha nem lenne a magyar írásbeliségben í, ú, ű, mégis tudnál mutatni olyan művet, amelyen szerepel a nevem, mégsem ezen az állásponton van.
Előzmény: Kis Ádám (178)
Kis Ádám Creative Commons License 2005.05.07 0 0 184

Az ószeresének valóban életszerű. Mifelénk jár egy lovasított ószeres, sose tudtam megfejteni, mit kántál, de annyira begyakorolt az előadása, hogy pontosan azonosítja magát.

 

Kis Ádám

Előzmény: Tecs (182)
Tecs Creative Commons License 2005.05.07 0 0 183

"Továbbra sem érzem, hogy az ének az automatikus elválasztás szempontjából komoly probléma lenne."

 

Szerintem sem az, és ez a lényeg.

 

De azért érdekes volt összeszedni a példákat.

Előzmény: Tecs (182)
Tecs Creative Commons License 2005.05.07 0 0 182

Kedves Kis Ádám,

 

közben én is rájöttem a tévedésemre.

 

Most korrigálok: ahány magas hangrendű toldalékolást igényló foglalkozásnév van, arra mind igaz az elválasztási probléma.

 

ószeresének
hentesének
szekeresének
cipészének
erdészének
csőszének
béresének

stb.

 

Előzmény: Kis Ádám (181)
Kis Ádám Creative Commons License 2005.05.07 0 0 181

Bocs Tecs!

 

Valaki valamit nem ért. Biztos én.

 

Szerintem melegének, hidegének, öregének, betegének, kerekének, örökének mint összetétételek általában külön írandók.

 

Az ősének vitatható határeset, viszont az elválasztás tekintetében indifferens, mert az ő után semmiképp nem lehet elválasztani.

 

A hősének,  regösének bevehető a szirénének mellé, de ezek sem valami nagyon gyakori szavak, úgy érzem.

 

A hősénekből 921 vana a gugliban, de ezekenek a nagyobb része érzáésem szerint a hős ragozott alakja, a regösénekből van vagy 120, ezek meg talán valamennyien az összetett szó előfordulásai.

 

Továbbra sem érzem, hogy az ének az automatikus elválasztás szempontjából komoly probléma lenne.

 

Kis Ádám

 

 

 

Előzmény: Tecs (177)
ZsB Creative Commons License 2005.05.07 0 0 180
Én szeretem kicsit "dinamikusabb" látni az egybe-külön dolgokat. Az elektronikusadat-feldolgozó rendszer nekem egyszerűen egy lehetőség az olyan esetekre, amikor szükség lehet a kontrasztálásra. Pont az adott példa nekem, az exkönyvtárosnak szinte triviális. Könnyen definiálhatok olyan könyvtári feldolgozórendszereket, amelyek nem elektronikusak (vagy nem csak), mert mondjuk a feltáró-katalogizáló személyi állományt meg munkafolyamatokat jelentik, és nagyon is értelmes megkülönböztetni, hogy a bemenet nem elektronikus (nyomtatott, mikrofilmes) vagy elektronikus (szalag, lemez, hálózat) adat.
Előzmény: Tecs (175)
Tecs Creative Commons License 2005.05.07 0 0 179

melegének
hidegének
öregének
betegének
kerekének

Azt hiszem, ezek mégsem jók, mert énekként külön írandók (mert nincs jelentésváltozás?)

 

Azért még tartom, hogy sok az életszerű énekes összetétel.

Előzmény: Tecs (177)
Kis Ádám Creative Commons License 2005.05.07 0 0 178

Kedves a viking!

 

tecs tulképpen elmondta a lényeget. Annyit lehetne hozzátenni, hogy a promblémának van bizonyos kollokációtörténete is. Valamikor az ötvenes évek végén megjelentek Magyarországon a gépi adatfeldolgozó központok (általában GAF-nak becéve). Ezek többnyire lyukkártyagépparkok voltak (szerencse, hogy ezt egybe lehet írni, mert ha tagolni kellene...). A 70-es évek közepén indult el ezek felszerelése számítógépekkel, és az intézmények ezt azzal próbálták jelezni, hogy a gépi jelzőt lecserélték az elektronikusra. Ebben az értelemben az elektronikus voltaképpen a számítógépes szinonimája.

ZSB példája lehetséges, de extrém, szintaktikailag helyes, pragmatikailag nem létezik.

 

Még egy dolog vált ki némi érzékenységet e téren: ugyancsak a 70-es évek újítása volt a hálózatok csíráinak kialakulása, amikor az adatfeldolgozás több gépen, híeadástechnika igénybevételével folyt. El is keresztelték ezt távadatfeldolgozásnak. Ez azonban a 6:3 hatálya alá esik, ezért meg kellett keresni a kötőjel helyét. Persze, ösztönösen mindenki az adat és a feldolgozás közé tette [távadat-feldolgozás]. Termásztesen, ha nagyon akarjuk, megmagyarázhatjuk, mi is az a távadat, viszont a táv értelmileg itt biztosan a feldolgozáshoz tartozik. Tehát táv-adatfeldolgozás a helyes megoldás. Én viszont inkább egybe szeretném írni, mert úgy érzem, a táv szó elválasztása itt nem igazán jó - bizonyos értelemben nem is tűnik önálló szónak, hanem talán klitikumnak.

 

Kis Ádám

Előzmény: a_viking (174)
Tecs Creative Commons License 2005.05.07 0 0 177

"Azt taláéltam, hogy az 'ének' igen kevés  szóban fordul elő utótagként, és ezek közül is igen kevés okozhat zavart. A legszebb a kiküszöbölendő példák közül valószínűleg a szirénének, és a legmókásabb (persze ez nem reális, mint összetétel) az énekének."

 

melegének
hidegének
öregének
betegének
kerekének
örökének
ősének
hősének

regösének

 

...szerintem még nagyon sok életszerű előfordulás van.

Előzmény: Kis Ádám (176)
Kis Ádám Creative Commons License 2005.05.07 0 0 176

Kedves DJG!

 

A probléma azóta ismerős, amióta próbálom oktatni a szövegszerkesztőt és az elválasztómodult.

Kedvenc példáim a megint, a felül és a legelőre.

 

Gondolom, a MorphoLogic a szóösszetételt valamiképp a kötött morfémák illesztése elé helyezi. A felsorolt példáid félreérthetők, például a

 

virágok az én rendeszeremben vi-rá-gok tagolással választódik el.

 

Véleméányem szerint ebben az esetben a Morfó nem jól okoskodott, mert az üzemzavarok, töréskárok összetett szóként esetleges, sőt erőltetett.

 

Azt azonban jó megoldásnak tartom, hogy a szemantikai alapon eltérően tagolható szavakat inkább tiltólistára teszik. Ugyanis figyelembe kell venni, hogy elválasztani nem muszáj, a nemelválasztás nem helyesírási hiba (hanem törderdelési, nem véletllen, hogy te precízebb vagy).

 

A viharosan iderondító bizonyára fiatalember felvetésein elgondolkodva kerestem példákat az 'ének' okozta zavarokra. Azt taláéltam, hogy az 'ének' igen kevés  szóban fordul elő utótagként, és ezek közül is igen kevés okozhat zavart. A legszebb a kiküszöbölendő példák közül valószínűleg a szirénének, és a legmókásabb (persze ez nem reális, mint összetétel) az énekének.

 

Kis Ádám

Előzmény: DJG (160)
Tecs Creative Commons License 2005.05.07 0 0 175

"elektronikus adatfeldolgozó rendszer, ha a rendszer elektronikus
elektronikusadat-feldolgozó rendszer, ha az adat elektronikus"

 

Ez így teljesen érthető.


Hozzáteszem, hogy még nem találkoztam elektronikusadat-feldolgozó rendszerrel, csak elektronikus adatfeldolgozó rendszerrel. Elektronikus adatokat nem elektronikusan feldolgozó rendszernek semmi értelme nem volna, tehát a gyakorlatban minden elektronikusadat-feldolgozó rendszer elektronikus adatfeldolgozó rendszer, az elektronikusadat-feldolgozó rendszer  szűkítő értelmezése nélkül, hiszen az elektronikus adatfeldolgozó rendszer bemenő adatokat dolgoz fel, függetlenül azok tárolási formájától.

 

Az elektronikus adatok biztonsági célú archiválásának ma is korszerű eszköze a mikrofilm, de az nem adatfeldolgozás.

Előzmény: ZsB (164)
a_viking Creative Commons License 2005.05.07 0 0 174
Ezzel nem értek egyet, túl leegyszerűsítve nézed. Lásd ZsB magyarázatát (167).

(A földalapú hitelt valóban elszúrtam, mentségemre legyen mondva, hogy jelen munkámban épp a "sötétborvörösszínű" [ja, így leírva] zagyvaságon agyaltam, szóval bocs.)
Előzmény: Kis Ádám (172)
Kis Ádám Creative Commons License 2005.05.07 0 0 173

Nézd, kedves Petigabi, én lehet, hogy bunkó vagyok, azonban van némi sejtésem arról, amiről beszélek.

 

Kiváncsi lennék szövegkörnyezetre, amelyben a borzalom a borz állattal összefüggésben fordul elő.

 

Ugyanígy, legutóbb az 'ének' példáját hoztad. Nagyon nem bánnám, ha sorolnád azokat az összetett szavakat, ahol az 'ének' az utótag, és ezzel kapcsolatban homonima jöhet létre. Ehhez fontos, hogy az előtag magas hangrendű legyen, nem változó tövű, és ne végződjék magánhangzóra.

 

Kis Ádám

 

PS.

Fura a bunkózás azután, hogy nagy tudatlanságodban kapásból minősítetted az elválasztóprogram gyártóját.

 

K.Á.

Előzmény: petigabi (162)
Kis Ádám Creative Commons License 2005.05.07 0 0 172

Kedves viking!

 

Az elektronikusan tárolt adat sem elektronikus adat, csak az adat elektronikus formája. Például a neved adat akkor is, ha elektronikusan, vagy ha pneumatikusan van tárolba.

 

Kis Ádám

Előzmény: a_viking (159)
petigabi Creative Commons License 2005.05.07 0 0 171
Másfelöl, ha jól sejtem, az egymásmellé kerülő névszók esetéről volna szó elsősorban. Érvek fogytán jól jön a személyeskedés, részemről sajnálatos. Ágyő...
petigabi Creative Commons License 2005.05.07 0 0 170

Sajátos nyelvi környezetben élhetsz...

Előzmény: ZsB (169)
ZsB Creative Commons License 2005.05.07 0 0 169
Süket.
Előzmény: petigabi (168)
petigabi Creative Commons License 2005.05.07 0 0 168
De az a kritérium csak az adott rendszerben létezik, s nem értem, mi a kapcsolata a nyelvvel. És ha valaki Ödönke első(?)bálozós élményét így írná le, bizony a beszélt nyelv sajátos ízét is érezhetnénk. De én még nem hallottam ilyen hangsúllyal beszélni senkit...
Előzmény: ZsB (167)
ZsB Creative Commons License 2005.05.07 0 0 167

Tényleg nem helyesírási kérdés, sőt helyesírási szempontból tökéletesen irreleváns, hogy a leírt szövegnek van-e érteleme, jelent-e valamit. Egyébként el tudok képzelni elektronikus adatot, mijazhogy! Aspektus kérdése az egész. Pl. az elektronikus(an működtetett) hordozókon tárolt adatokat jól meg tudom különbözteteni a papíron vagy kőbe vésve tároltaktól, és bizony az az adat attól is "elektronikus" lesz. És el tudok képzelni elektronikus rendszert, amely papíradatokat (papírhordozókon tárolt adatokat) dolgoz fel. És milyen jó, gondolom én, hogy helyesírási eszközökkel jelezni tudom a két dolog különbségét akkor is, ha a jelentéstömörítés két útja ugyanarra a szóláncra vezet.

 

Azért nem lehet "egyszerűen" az a szabály, mert a(z összetett) szó kritériuma ennél sokkal bonyolultabb. A te egyhangsújos szabályoddal pl. azt kéne írni, hogy Ödön táncolniakaramagasfeketelánnyal.

Előzmény: petigabi (166)
petigabi Creative Commons License 2005.05.07 0 0 166

oké, szerintemis, de miért? Egyébként el tudsz képzelni elektronikus adatot? Mármint feldolgozó rendszer nélkül. Szerintem az adat adat, s hogy azt feldolgozása, tárolása során elektronikusan ábrázoljuk, egy más kérdés. Persze ez nem helyesírási kérdés. Legalább is nem kéne, hogy az legyen.

 

Miért nem lehet egyszerűen az a szabály az egybeírásra, hogy ha egy hangsúllyal ejtjük, egybe is írjuk? Miért jó az, hogy írás közben (amikor úgy is zsibog az ember feje a leírni szánt dolgoktól) még röptében elvégzett szóelemzésekkel is fárasztjuk magunkat?

Előzmény: ZsB (164)
petigabi Creative Commons License 2005.05.07 0 0 165
Valóban nem vagyok nyelvész. Hál’isten nem vagyok nyelvészkedő, nyelvművelő sem. Az viszont határozott visszatetszést kelt, ha valaki nagytudású azzal kezd, hogy visszakézből lefikáz mindenkit. Az önhittség ezen foka engem meggondolatlan kirohanásokra szokott ragadtatni. De ha gondoljátok, hogy ez a hejjjjes (t.i. azzal kezdeni a "beszélgetést" valakivel, hogy gyorsan fixírozzuk: semmihez nem ért), hát tömjént neki...
Előzmény: rumci (163)
ZsB Creative Commons License 2005.05.07 0 0 164

földalapú hitel

 

elektronikus adatfeldolgozó rendszer, ha a rendszer elektronikus

elektronikusadat-feldolgozó rendszer, ha az adat elektronikus

Előzmény: petigabi (155)
rumci Creative Commons License 2005.05.07 0 0 163
Szerintem véletlenül a tükörbe néztél, és nem Kis Ádámra.
Előzmény: petigabi (161)
petigabi Creative Commons License 2005.05.07 0 0 162
Csak egy példa a nagy szemantikádhoz: a borz-alom és borzalom mint kedvenc példája a magadfja szemantikára hivatkozó IT-analfabéta hülyéknek, mindenfajta szemantika nélkül, csupán egy jó korpusz statisztikai elemzésével kimutatja, hogy melyikre kell felkészülni...
petigabi Creative Commons License 2005.05.07 0 0 161

Bunkó

Előzmény: Kis Ádám (157)
DJG Creative Commons License 2005.05.06 0 0 160
Az idézett eseteket a számítógép sajátosan kezeli. Minthogy ezek a szavak morfológiai homonimák (alakilag egybeesnek, de eltérő a morfológiájuk), a magyar elválasztó nem tudja őket következetesen jól kezelni. Az automatikus elválasztás alapból a következőt produkálja:

üzemzavar-ok
zava-rok
virá-gok
törés-károk (a károk szót nem hajlandó elválasztani, sem magában, sem összetételben)


Az enyém (többféle tördelôprogramhoz írt szótagolómodul) ilyenkor inkább nem tekinti ôket összetett szónak, tehát:

ü-zem-za-va-rok
za-va-rok
vi-rá-gok
tö-rés-ká-rok
ká-rok

A 'károk' a Morphologicnál nyilván azért került tiltólistára, mert a kár-ok gyakran elôforduló forma. Mivel én tördelôprogramhoz írtam a szótagolómodult, ahol a kivételszótár mindennapos dolog, én inkább úgy döntöttem, hogy ilyen esetekben sem döntök a felhasználó helyett, ha az ô praxisában az egyik vagy a másik változat gyakoribb, vegye fel magának a kivételszótárba. Egyébként a modul készítése közben százszámra találkoztam ilyen többféleképpen értelmezhetô szóval, közülük sok mulatságossal, meg is akartam jegyezni ôket, aztán elfelejtôdtek. Egyre még emlékszem: Lázár kontra láz-ár.

Üdv,
Gábor
Előzmény: Kis Ádám (128)
a_viking Creative Commons License 2005.05.06 0 0 159
Gondoltam erre is, de szerintem itt elektronikusan tárolt adatok rendszeréről van szó.
Előzmény: Kis Ádám (158)
Kis Ádám Creative Commons License 2005.05.06 0 0 158

Bocs, miért is?

 

elektronikus adatfeldolgozó rendszer

 

Nem az adat elektronikus, hanem a feldolgozó rendszer.

 

Kis Ádám

Előzmény: a_viking (156)

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!