Sziasztok,
egy erdekes felvetes, ki tud a "kurva" szo eredeterol. A lengyelek is "magukenak erzik", meg mi is.
Szerintetek, eredetileg ez magyar eredetu szo vagy tenyleg importaltuk valahonnan - mondjuk a lengyelektol?
És pont ezért nem lehet általános fordítóprogramot készíteni, sajnos (?) A WordNet kezdeményezésnek nem rossz, de egynyelvű, nem kontrasztív, ezért a jelentések felbontásában elkerülhetetlenül soviniszta. A lefordított verziói így soha nem adhatnak ki egy koherens és átfogó szótárat (gépileg feldolgozhatót pedig még kevésbé).
nadamhuval egyébként egyetértek, a fordítóprogram valóban csak az ostoba sztringből tud kiindulni. De ha egy olyan nyelvi adatbázisban kereshet, amelyben a jelentések kommunikációs játéka, mozgása, egymásba csúszása, valamint a klasszikus ontológiai rendszere (az ilyen fába rendezhető részterületeké legalábbis) már be van kódolva, akkor nagyobb az esély az élőnyelvet közelítő fordításra. Ahogy írja: "analóg" - ez tetszik :) Pontosabban, ott analóg, ahol a szabad verbális gondolkodás kényszerű digitalizálása nem jár eredménnyel (lásd szemantikai megkülönböztető jegyek +/- jelöléssel). A jó hír, hogy ilyen rendszer már nem csak modellszinten, hanem a gyakorlatban is működik, bár a nyelvi adatokkal való feltöltése iszonyú sok munka, ezért viszonylag lassan halad, de hamarosan lefedi a magyar alapszókincshez rendelhető jelentéseket.
Csak annyit szeretnék hozzátenni, hogy a nyelv rugalmassága miatt a jelentések lehetnek alkalmiak, és az így "felszerelt" szavak betölthetik a funkciójukat. Ez a tulajdonság az alapja a jelentésátvitelnek. Tehát ahhoz, hogy a szövegelem jelentését géppel azonosítsuk, nagyobb szövegkörnyezetet kell vizsgálni. Így is csak szinkrón szinten érhetünk el eredményeket, mert idpben előremutató szemantikai hálót készíteni valószínűleg elég nehéz.
Amúgy szerintem egészen reményt keltő eredmények léteznek ezen a téren (wordnet), bár ezek gyakorlati értéke még aligha haladja meg a kutatási szintet.
Kis Ádám
(Tudom, egy csomó redundancia van, de a szabályok bevitelére csináltam egy tool-t, így nem kell ennyire sokat gépelnem, viszont a spec. esetekre jól jön ez a részletesség.)
Amúgy igazad van. Pl. az 'affiliate' csak egy angol sztring. és megnéztem, ennyi minden tartozik hozzá a fordítóprogramomban: (Ezt persze nem nevezném a nyelv mélyére nézésnek, tudom, hogy csak a felszínt karcolgatom.)
Most jól megmagyaráztad, hogy a 'papír' az csak egy sztring. és szerinted nem ez a sztring, hanem az ezáltal kijelölt 'valamik' (amibôl többet is kijelöl) viselkedik fônévként.
Ezeket a valamiket te jelentésnek hívod.
Ez mondjuk egy triviális modell. (mert ugye egyszerůsítô modelleket alkotunk a nyelvre, ami amúgy nagyon bonyolult.)
Miért gondolod, hogy erre nem jöttem rá? (Mellesleg valahogy így můködik az általam írt fordítóprogram is.)
Ahhoz, hogy mondjuk fordítani tudjunk, meg kell próbálni valamiféle nyelvtani, szintaktikai modellt találni. Ennek az alapja pedig szerintem nem lehet más, mint az általad semmitmondónak titulált sztringek kategorizálása.
Kénytelenek vagyunk tehát elôször ezekkel a 'semmikkel' fonémafüzérekkel kezdeni valamit.
Namost az, hogy pl. a 'papír'-t egyszerre több kategóriába is sorolhatjuk (melléknév és fônév), vagy csak egy kategóriát engedünk egy sztringnek (melléknévisésfônévislehetkategória) már kódolási kérdés. Egyszerůbb a modell, ha egy sztring csak egy kategóriába eshet, de ilyenkor persze túl sok lesz a kategóriák száma.
Persze ha megvagyunk a szintaktikai elemzéssel szükséges valamiféle szemantikai elemzés is.
Az is egy lehetséges érv, hogy nem lehet különválasztani a szinaktikai elemzést a szemantikaitól. Erre hajlok én is, de hát ez így nem sokat mond. Ha modellezni akarjuk a nyelvet kénytelenek vagyunk valamilyen egyszerůsített modellel dolgozni.
Szóval én is tudom, hogy finomabb, erôsen szemantikai kategorizálásra lenne szükség, és ha behunyom a szemem, azt látom, hogy 50 év múlva olyan nyelvi modellek léteznek majd, amikor is a 'papír' szóhoz lapozva a képzeletbeli szótárban, a hangalakot hamar elhagyva csupa analóg (nem digitális) szemnatikai kapcsolatok jelennek meg, mintegy neurontérképeket alkotva, ahol végül is fogalmak lesznek összekötve fogalmakkal (meg persze hangalakokkal), de ezek a fogalmak sem lesznek teljesen behatárolhatóak, minden elmosódott analóg lesz. De ma még nincs ilyen modell (szerintem).
Mi értesz azon, hogy "papír"? Szerintem ez semmise: öt betű, egy karakterlánc, egy fonémafüzér. Miért lenne ez melléknév vagy főnév vagy bármi? Viszont van olyan "dolog", lehetőség, reláció stb. a világegyetemben - nevezzük röviden fogalomnak vagy jelentésnek, hogyaszongya:
1. 'fából, rongyból, mifenéből készült anyag' nyelvi kijelölői: papír, papiros. "Papírt gyárt."
2. 'ebből az anyagból egy lap v. darab': papír, lap, fecni, sajtcédula "Adj egy papírt."
3. 'papírra nyomtatott dokumentum': papír, dokumentum, igazolvány, útlevél "Nincsenek rendben a papírjai."
Hadd ne soroljam, az értelmező szótárakban finomabb-durvább felbontásban ki vannak dolgozva. Ezek - és nem a "papír" sztring! - viselkednek főnévi elemként egy közlésben. Egyes melléknevesebben viselkedő elemeket is kijelölhet ez a hangsor, pl.
4. 'papírból készült': papír(-), papírból készült, papírból való "papírhajó", "papír védőborítás"
5. 'papírhoz való, azzal kapcsolatos': papír- "papírkés", "papírgyár"; és még akármeddig lehetne bontogatni azokat a jelentéseket, amelyeket (magyar nyelven) ez a kijelölő felidézhet az agyunkban. Képzeld el ugyanezt pirosban vagy más nyelven...
Sok fáradságtól megkímélheti magát a nyelvészkedő, ha a nyelv felszíne alá néz.
Hadd hívjam fel a figyelmet arra az apróságra, hogy bizonyos nyelvekben nem létezik fokozás, tehát általános nyelvészetileg nem tekinthető a "melléknévség" kritériumának:) (Bocsánat a belekontárkodásért, nem vagyok magyar nyelvész.)
Huh, csak egy percig nem figyelek, és elszalad a topik (meg a komment, a fókuszról és a kvantorokról nem is szólva).
„Azért nem triviális az sem, hogy mit értünk melléknév alatt.”
Valóban, és egyáltalán nem az. Kiefer Ferenc a Jelentéselmélet című könyvében elég hosszasan vacakol azzal, hogy a főnevet, melléknevet, igét el tudja különíteni. Tanulságos olvasmány.
„Olyan névszó, ami nem tölthet be pl. alanyi szerepet a mondatban. (Ellenpélda: 'A piros volt a legszebb.')”
Nem ellenpélda, mert a piros (és általában a színnevek) kettős szófajú: melléknév és főnév egyaránt. (Az amerikai, jótevő, szoknyabolond, papír, sőt általában a népnevek, anyagnevek szintén kettős szófajúak.)
Ráadásul bekavarhat itt még az alkalmi szófajváltás is. Ebben a mondatban: Az eszik ikes ige. az eszik aktuálisan főnév. Mindenképpen meg kell tehát különböztetnünk a lexikai és az aktuális szófajt. Olyan nyelvek vannak, ahol az előbbi nem létezik (pl. kínai, de az angol is efelé tart), míg az aktuális szófajok léte nyelvi univerzálé.
„Ha szintaktikailag helyes lesz, akkor a szó fônév, ha nem, akkor melléknév.”
Csak hát a főnév és a melléknév nem egymást kizáró kategóriák. Egyébként a teszt azt jól mutatja meg, hogy helyes → főnév. (A szomszéddal még az is baj, hogy általában megkövetel egy birtokos jelzőt, és így önmagában bizonytalan a jósága.)
„A tôszámnév valószínüleg besorolható a melléknevek közé.”
Akkor nézd meg a két és a kettő (vagy esetleg a kis és kicsi) szavakat (még megteheted, néhány évtized múlva lehet, hogy a két szót nem fogja már senki ismerni), és az szépen mutatja, hogy mikor melyik. A többi számnév esetében a két alak egybeesik.
„(Ezzel a megközelítéssel esetleg az lehet a gond, ha fônévvel jelezünk, bár azt az írásban ha jól sejtem általában egybe írjuk: pl. 'ablakkeret', 'elefántcsont'”
Itt rendesen bejön a helyesírás. Azt pedig el kell dönteni, hogy beengedjük-e, vagy sem. Én az utóbbira voksolnék, bár ezen a téren többnyire jó fogódzókat ad. Az ablakkeret és az elefántcsont jelöletlen birtokos jelzős összetételek, tehát a melléknéviség fel sem merül. Ugyanakkor az orvos barát stb. típusnál főnevek kerülnek alkalmi jelzői (tehát melléknévi) pozícióba.
Jogos!
Ki kellene találni, hogy miért melléknevek: az 'amerikai', 'jótevö', 'szoknyabolond' szavak. Hmmm.
Most már csak egy ötletem maradt:
Melléknév az, amit berakhatsz a következô sablonok legalább egyikébe:
'Egy [szó] kutya.'
'A [szó] ůrállomás.'
Egy amerikai kutya
Egy jótevö kutya.
Egy szoknyabolond kutya.
A szomszéd ůrállomás.
(Ezzel a megközelítéssel esetleg az lehet a gond, ha fônévvel jelezünk, bár azt az írásban ha jól sejtem általában egybe írjuk: pl. 'ablakkeret', 'elefántcsont', meg amúgy is csak speciális kombinációk esetén érezzük helyesnek a magyarban. (Az 'ablak csont' meg az 'elefánt keret' ugye helytelen?)) Az angolban rosszabb a helyzet, mert ôk elég lazán jeleznek fônévvel.
Pl. 'machine translation' amit a magyarba 'gépi fordítás'-ként fordítunk. Vajon akkor ôk hogyan különböztetik meg a fônevet a melléknévtôl?
Fônév X, ha helyes 'Pisti egy X', és X nem fokozható. (Biztos erre is lesz ellenpélda:)) Pisti egy amerikai.
Pisti egy jótevö.
Pisti egy szoknyabolond.
A számnevek között a többség melléknév, de van köztük főnév is. Melléknévvé nem a fokozhatóság tesz, hiszen vannak fokozhatatlan melléknevek: szomszéd, hajadon, terhes stb.
Az, hogy az angolban (és a magyarban is) determináns a számnév, más kérdés, hiszen az már mondattani és nem szófajtani kategória ebben a vonatkozásban.
A Hat kutya ugat esetében nem névelői a szerep, hiszen az A hat kutyám ugat és A barna kutyám ugat mondatokban épp melléknévvel azonos a disztribúciójuk. Azért nem triviális az sem, hogy mit értünk melléknév alatt. Naivan ilyenekre gondolnék:
- Olyan névszó, ami nem tölthet be pl. alanyi szerepet a mondatban. (Ellenpélda: 'A piros volt a legszebb.') Fônév elé rakva jelzôként viselkedik. (Akkor az elefánt melléknév: 'elefánt köröm'.)
Mit szólnál ahhoz, hogy vegyünk egy vízválasztó tesztet: Tegyük be a szót a következô sablonba:
Pisti egy [szó]
Ha szintaktikailag helyes lesz, akkor a szó fônév, ha nem, akkor melléknév.
Pl:
Pisti egy kutya. Helyes: A 'kutya' fônév.
Pisti egy szép. Helytelen: A 'szép' melléknév.
(érezhetô, ahogy pl. a 'szomszéd' szó ott lebeg a határon. Nekem eléggé fônévnek tůnik.)
Mindenesetre gondolom nem is az a lényeg, hogy mit hogy nevezünk, hanem hogy viszonylag precíz ismérvek álljanak a kategorizálás mögött.
(Nekem szimpatikus lenne amit már említettem: elôször teljesen szétszedni a szavakat pici ekvivalenciaosztályokba, (tisztán formai szempontból) és aztán elkezdeni összerakni ôket kategóriákba.)
A tôszámnév valószínüleg besorolható a melléknevek közé, de azért figyelemreméltó, hogy azon belül szintaktikai szempontból elkülönül: az összes melléknévi jelzô elôtt szerepel a fônévi részben. (Hat szép kutya vs. Szép hat kutya: a másodikat helytelennek érzem.) (Ezért kevertem össze a determinánssal, ami persze a tôszámnév elôtt szerepel.)
Grammatikából klasszikus jellegű a Keszler Borbála szerkesztette Magyar grammatika (Nemzeti Tankönyvkiadó, Budapest, 2000), az előbb említett könyvben modern (poszt)generatív nyelvtan van, kb. megegyezően az Új magyar nyelvtannal, ha annál bővebben érdekel, akkor ajánlható a Strukturális magyar nyelvtan eddig megjelent három vaskos kötete, de az már nagyon szakszöveg, előtte mindenképpen érdemes lenne alaposan végignézned a citált kötetet, ami egy elég izgalmas összefogalaló a ma élő különféle nyelvészeti részdiszciplínákról. Ha generatív szintaxist akarsz készségszintig begyakorolni, akkor pedig ajánlom az Alberti–Medve: Generatív grammatikai gyakorlatok című kétkötetes művet. Ennek a beszerzése elég nehézkes, Budapesten boltban egyedül az Osiris könyvesboltban, a Ferenciek tere mögött láttam.
A számnevek között a többség melléknév, de van köztük főnév is. Melléknévvé nem a fokozhatóság tesz, hiszen vannak fokozhatatlan melléknevek: szomszéd, hajadon, terhes stb.
Az, hogy az angolban (és a magyarban is) determináns a számnév, más kérdés, hiszen az már mondattani és nem szófajtani kategória ebben a vonatkozásban.
A Hat kutya ugat esetében nem névelői a szerep, hiszen az A hat kutyám ugat és A barna kutyám ugat mondatokban épp melléknévvel azonos a disztribúciójuk.
„Még a végén kiderül, hogy grammatikailag az 'egy'-et nem kell határozatlan névelônek tekinteni, hanem ugyanolyan tôszámnév, mint a hat.”
A kurrens generatív elméletek pontosan így gondolják. (Sőt hozzáteszik, hogy van a magyarban határozatlan névelő is, de az mindig zéró fokon jelenik csak meg.)
A határozott névelő azonban tisztán elkülönül a mutató névmástól (a dolog történetisége miatt legfeljebb a névelő lehetne névmás, a névmás nem lehetne névelő).
„Ennek a kategorizálásnak nem az lenne a legprecízebb módja, hogy megnéznénk, hogy mely szavak (vagy inkább morfémák) cserélhetôek fel tetszôlegesen úgy, hogy a szintaktikai helyesség ne változzon?”
De. A szófaji rendszerezés (egyik) legfontosabb szempontja éppen ez.
„Vajon hány ilyen ekvivalenciaosztály van a magyar nyelvben?”
Jó nehéz kérdés. Szerintem senki se válaszolt még rá. Az biztos, hogy a nagy szófajokon belül nagyon sok szófaji alkategória jönne így elő.
„Egyáltalán hány morféma van?”
Szabad tőmorféma mintegy 8-10 000, toldalékmorféma kb. 200, kötött tőmorféma néhány. A kérdésre adott választ kb. egyetlen dolog módosíthatja, az az, hogy mennyi idegen szót engedünk be a vizsgálatba.
„Persze tudom, hogy a morfémákra bontás is szubjektív egy kicsit.”
Valóban elég kicsit, úgyhogy én ezzel nem is nagyon számolnék. A disztribúciós elemzés meglehetősen egyértelmű.
Hú, ez így nagyon nehéz, nagyon általános. Ha nem kizárólag a grammatika érdekel, jó szívvel ajánlom a Kiefer Ferenc szerkesztésében A magyar nyelv kézikönyve címmel az Akadémiai Kiadónál 2003-ban megjelent könyvet. Ezt általában megtalálni a könyvesboltokban, de gondolom a szakkonyv.hu-ról is meg lehet rendelni. (Esetleg ránézhetsz a nekeress.hu-ra is.)
Tudnál nekem ajánlani valamilyen jó könyvet a magyar nyelv leírásáról? (Ha írsz légyszíves azt is írd már meg, hogy hol szerezhetem be; Budapesten lakom.)
(Azért írom, hogy főnévi, mert a számnév mint szófaj léte is erősen kétségbe vonható.) Valóban, pl. a tőszámnevek szintaktikailag szinte pontosan ott szerepelhetnek, mint a főnevek.
(Első ránézésre a melléknevek közeli rokonai. De mégsem, mert a főnév és a melléknév is közeli rokonok, és szerintem pont az tesz valamit melléknévvé, hogy fokozható. A tőszámnév meg nem fokozható, tehát akkor már inkább főnév közeli rokona.)
Érdekes, hogy az angolban pedig a számokat leginkább determinánsként érdemes kezelni. (De a magyarban is rokon a névelőkkel.)
Mit szólsz a következôhöz: lehet névelôi és fônévi szerepben:
Hat kutya ugat.
Abból kérek hatot.
Még a végén kiderül, hogy grammatikailag az 'egy'-et nem kell határozatlan névelônek tekinteni, hanem ugyanolyan tôszámnév, mint a hat.
Sôt az 'az' mutató névmás az csak az 'a/az' névelô fônévi fajtája!
Ekkor mondhatnánk, hogy:
Vannak fônevek, amelyek determinánsi szerepet is elláthatnak, ilyenek pl. 'egy', 'négy', 'az'.
Ennek a kategorizálásnak nem az lenne a legprecízebb módja, hogy megnéznénk, hogy mely szavak (vagy inkább morfémák) cserélhetôek fel tetszôlegesen úgy, hogy a szintaktikai helyesség ne változzon? Pl. a 'doboz' és a 'vödör' szavak tuti egy ketegóriába kerülnének. Vajon hány ilyen ekvivalenciaosztály van a magyar nyelvben? (Egyáltalán hány morféma van? Persze tudom, hogy a morfémákra bontás is szubjektív egy kicsit.)
Hogy a két mint-es kifejezés elliptikus mellékmondat-e, vagy elöljárószós főnévi csoport, az valóban vitatható, igazán erős érvek nincsenek egyik oldalon se. Én az általánosabban elterjedt megoldást írtam le.
A több mint hat főnévi szerkezetben a több mint kifejezést manapság becslő partikulának szokás tartani (legalábbis a Magyar grammatika így tesz). (Azért írom, hogy főnévi, mert a számnév mint szófaj léte is erősen kétségbe vonható.) A partikulákra az jellemző, hogy nem töltenek be mondatrészi szerepet, nem lehet rájuk sem kiegészítendő, sem eldöntendő kérdéssel kérdezni, a szintaktikai struktúra megsértése nélkül elhagyhatók a mondatból (bár ez alól kivételként szokták említeni a Csupa csoki a szád; Csurom egy víz a ruhád típusú mondatokat).
Kössz, én is hasonlóra jutottam:
A főmondat: 'Nem olyan vagy.'
Az 'olyan'-hoz pedig 2 alárendelt kifejezés is tartozik:
'mint más'
'mint Kuczugh Balázs'
Csak én elfogadtam, hogy a 'mint + főnévi rész' alárendelt kifejezést alkothat, nem gondoltam végig, hogy az 'amilyen' odagondolásával ezek is névszói állítmányos mondatok.
Egyébként érdekes, hogy én ezt (Nem olyan, mint más, mint Kuczugh Balázs) az interneten valóban, az előtte lévőtől elkülönülő mondatként találtam meg, vagyis ez a 'mondat' az elôtte lévő szöveg által kilakított kontextus nélkül (levegőben lógó alany: Te) nem elemezhető.
Még mindig a 'mint'-nél maradva, hogyan elemzik a következôt?:
'Több mint 6 kutya van a kertemben.'
Az OK, hogy a főmondat alanya a [Több mint 6 kutya], de ezt hogyan szokás továbbbontani?
Én azt mondanám, hogy a [Több mint 6] számnévi rész, ami egy speciális [Több mint] számnév módosítóból és a [6] számnévből áll.
Érdekes, hogy a nyelvtan bonyolultsága néhány 'ördögi' szónak köszönhető, mint pl. a magyarban a: 'mint', 'csak', 'még', 'éppen', 'szintén', 'nem'. Vagy az angolban a: 'only', 'even', 'as', 'than', 'so', 'also', 'still', 'not'
Ezek a legkacifántosabb helyeken fordulnak elő, miközben több ezer főnév és ige viszonylag illedelmesen viselkedik és engedelmeskedik a beskatulyázásnak:)
Nézzük először az egész mondatot: Te vagy a legény, Tyukodi pajtás, nem olyan, mint más, mint Kuczugh Balázs. Így látszik, hogy a második tagmondat valójában ez: [te] nem olyan [vagy], mint [amilyen] más, mint [amilyen például] Kuczugh Balázs. Ez egy alárendelő összetett mondat, tehát meg kell nézni, hogy a rámutatószó (olyan) milyen mondatrészi szerepet tölt be a főmondatban. Mivel az ilyen azonosító mondatokban az egyeztetés miatt a személyes névmást szokás alanynak tekinteni, az olyan az állítmány névszói része. Tehát állítmányi alárendelésről van szó, amely alárendelésnek hasonlító sajátos jelentéstartalma is van. A főmondatnak rendelődik alá tehát a két mellékmondat, amelyek között kifejtő magyarázó, tehát mellérendelő viszony van.