Keresés

Részletes keresés

polites Creative Commons License 2004.05.18 0 0 41
"Azért a kumulatív és a kiterjesztett exponencia elég problémás tud lenni ha jól sejtem..."

Persze, az összevonódások mindig betartanak a szép strukturális rendszereknek. Szeretik is kizárni az olyan szabályokat, amelyek törlést eredményeznek, mert az a szintézisnél ugyan nem nagy gond, de az analízist igen megnehezíti.

Előzmény: DrDGF (40)
DrDGF Creative Commons License 2004.05.18 0 0 40
"Szemantikától eltekintve is, Chomsky generatív rekurzív modelljei jók a rögzített szórendű, izoláló nyelvek kezelésére, de nem annyira jók a szabad szórendű erősen toldalékoló nyelvekre, bár magát a toldalékolást is általában le lehet írni hasonlóan."

Azért a kumulatív és a kiterjesztett exponencia elég problémás tud lenni ha jól sejtem...

Előzmény: polites (18)
Törölt nick Creative Commons License 2004.05.17 0 0 39
Nem baj. Én (is) csak kopok az évekkel:))).
Előzmény: DrDGF (38)
DrDGF Creative Commons License 2004.05.17 0 0 38
Hát igen, mostanában nem vagyok túl aktív. De Te sem...:)
Törölt nick Creative Commons License 2004.05.13 0 0 37
Hello, Dr.DGF, rég láttalak:)!
Előzmény: DrDGF (36)
DrDGF Creative Commons License 2004.05.13 0 0 36
Nadamhu, írtam email-t, de nem a megadott, hanem egy másik címről. Ki ne töröld rutinból:)
Előzmény: nadamhu (35)
nadamhu Creative Commons License 2004.05.12 0 0 35
Sajnos én eléggé 'outsider' vagyok nyelvészeti témákban.
Erről a konferencáról sem hallottam még.
A CD-vel kapcsolatban írtam neked email-t az itt megadott címedre.
Előzmény: DrDGF (34)
DrDGF Creative Commons License 2004.05.11 0 0 34
Nadamhu, tavaly november elején volt egy konferencia, "Mire jó a nyelvtechnológia? Új eredmények a magyar nyelv számítógépes feldolgozásában" címmel. Volt előadás a fordítási problémákról és a Morphologic eredményeiről is (bár ez utóbbi inkább termékbemutató volt). Osztogattak CD-ket az előadások handoutjaival, nekem meg is van...
nadamhu Creative Commons License 2004.05.09 0 0 33

--------------------------------------------
Input text:
He said that that 'that' that that man used was wrong
-------Best meaning possibility-------:
ST rel=V_THAT state=3001 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[12] crturn=8 points=6
Composites:
ST rel=V_SAY state=4119 negated=false mood=DECLARATIVE time=PAST comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[2] crturn=3 points=2
SLOT SLOT_SUBJECT
E noun=N_HE det=[S 0 ] state=407 bwu:false beg=[0] end=[0] crturn=1 points=1
SLOT SLOT_OBJECT
E noun=N_THAT det=[S 0 ] state=1 bwu:false beg=[2] end=[2] crturn=1 points=1
ST rel=A_WRONG state=3 negated=false mood=DECLARATIVE time=PAST comp=COMP_BASIC modifier=MOD_NOTHING beg=[4] end=[12] crturn=7 points=3
SLOT SLOT_SUBJECT
E noun=N_THAT det=[S 0 ] state=4201 bwu:false beg=[4] end=[10] crturn=5 points=2
ST rel=V_USE state=711c negated=false mood=DECLARATIVE time=PAST comp=COMP_BASIC modifier=MOD_NOTHING beg=[7] end=[10] crturn=4 points=2
SLOT SLOT_SUBJECT
E noun=N_MAN det=[D_THAT 0 ] state=1 bwu:false beg=[8] end=[9] crturn=2 points=2
SLOT SLOT_OBJECT
E noun=N_THAT det=[S 0 ] state=0 bwu:false beg=[7] end=[10] crturn=4 points=2

Hungarian tree:
ST rel=VH_HOGY state=3001 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[12] crturn=8 points=6
Composites:
ST rel=VH_MOND state=4119 negated=false mood=KIJELENTO time=MULT comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[2] crturn=3 points=2
SLOT SLOT_ALANY
E noun=NH_OE det=[S 0 ] state=407 bwu:false beg=[0] end=[0] crturn=1 points=1
SLOT SLOT_TARGY
E noun=NH_AZ det=[S 0 ] state=1 bwu:false beg=[2] end=[2] crturn=1 points=1
ST rel=AH_ROSSZ state=3 negated=false mood=KIJELENTO time=MULT comp=COMP_BASIC modifier=MOD_NOTHING beg=[4] end=[12] crturn=7 points=3
SLOT SLOT_ALANY
E noun=NH_AZ det=[S 0 ] state=4201 bwu:false beg=[4] end=[10] crturn=5 points=2
ST rel=VH_HASZNAAL state=711c negated=false mood=KIJELENTO time=MULT comp=COMP_BASIC modifier=MOD_NOTHING beg=[7] end=[10] crturn=4 points=2
SLOT SLOT_ALANY
E noun=NH_EMBER det=[D_THAT 0 ] state=1 bwu:false beg=[8] end=[9] crturn=2 points=2
SLOT SLOT_TARGY
E noun=NH_AZ det=[S 0 ] state=0 bwu:false beg=[7] end=[10] crturn=4 points=2

Hungarian morphem sequence:
Az +targy mond +mult +targyas +e3 , hogy az , az a ember ami +targy használ +mult +targyas +e3 , rossz van +mult +e3

Hungarian output:
Azt mondotta, hogy az, az az ember amit használta, rossz volt


Az én programom persze egy csomót hibázik, tele van ad-hoc szabályokkal, szóval korlátozott nyelvi tudása van azért, mert szempont volt, hogy 2 év alatt kész lehessek 'valamivel'.
Egyébként egy hónapon belül bárki kipróbálhatja majd on-line az interneten.
A következô oldal egészen fel lesz újítva, most nincs gyakorlatilag semmi az oldalon:

http://www.cybertron.hu

Előzmény: Tim the Enchanter (31)
polites Creative Commons License 2004.05.09 0 0 32
Vannak olyan esetek is, amik gépileg teljesen tiszták, nagyobb gondot okoznak az embernek szokatlanságuk miatt:

"The mouse the cat the dog chased bit died."

Az ember ugyanis nem strukturálisan (helyesebben: csak korlátozottan strukrurálisan) fogja fel a nyelvet.

Előzmény: Tim the Enchanter (31)
Tim the Enchanter Creative Commons License 2004.05.09 0 0 31
nadamhu:
Mit kezd a programod a következő mondattal:
"He said that that 'that' that that man used was wrong."
polites Creative Commons License 2004.05.08 0 0 30
Nem olyan nagy ám a különbség a magyar toldalékolt alakok és az angol "szerkezetek" között. Hiszen általában ezeket mi is könnyen le tudjuk fordítani.
A toldalékolás annyiban segít, hogy a szóközök jól elválasztják azokat az egységeket, amiket angolban csak nehezebben tudunk azonosítani.

Pl.: házainkban - in our houses
Ugyanazok a jelentés-részelemek felismerhetők mindkét nyelven, de a magyar ezt egyértelművé teszi az egybeírás miatt, míg az angolban rá kell jönnünk, hogy összetartoznak.

Ha egyik nyelvben sem használnánk szóközöket, mint a korai középkori és ókori írásokban, akkor ugyanolyan nehéz lenne mind a kettő. :)

Tehát nem igazán lényeges különbség.

Előzmény: nadamhu (29)
nadamhu Creative Commons License 2004.05.08 0 0 29
Ami még érdekes, hogy a morfológia volt a legkönnyebben kezelhetô rész, gyakorlatilag ma már tökéletesen kezeli a programom. Pedig terjed az a nézet, miszerint a magyar nyelv a toldalékolása miatt olyan nehezen kezelhetô nyelv. Azt kell mondanom, hogy ennek a legkisebb a jelentôsége. Az igazi bonyolultság az egyik nyelv morfémasorozatának a másik nyelv morfémasorozatára való fordításában van. Sajnos komplexebb mondatoknál az angol ugyanolyan nehezen kezelhetô nyelv, mint a magyar. Sôt, újabban hajlok arra, hogy a magyart talán még egy picit könnyebb is elemezni mint az angolt, az a sok toldalékmorféma elég sok támpontot ad.
Előzmény: nadamhu (28)
nadamhu Creative Commons License 2004.05.08 0 0 28
Igen, így van ahogy mondod, ezért ilyen sok energiát felemésztô munka ez. Nekem is mondták már, hogy miért nem viszek bele a programomba automatikusan komplett, már elkészült szótárakat. Sajnos nem megy, mert az emberi használatra szánt szótárak nem elég egzaktak.
Előzmény: polites (27)
polites Creative Commons License 2004.05.08 0 0 27
"Kegyetlen sok meló egy embernek, munkahely mellett..."

"én úgy tůnik, hogy felraknám rá az életemet, ha a finanszírozás meglenne rá."

Így van.
Engem is mindig érdekelt a gépi fordítás, de láttam/látom a nagy nehézségeket.

Képzeld el a következő gondolatkísérletet.

Fordítanod kell egy általad nem ismert nyelvről egy általad nem ismertre, normális, nem könnyített szöveget. Mondjuk grúzról albánra.
Megkapod a szótárokat és a nyelvtankönyveket.

Azt hiszem egyetértesz velem, hogy nehéz a helyzeted. Jó sok időt kell eltöltened, míg az első nemtriviális mondat hibátlanul kikerül a kezeid közül.
Miért? Hiszen csak egy-két tucat szóval van dolgod.
Azért, mert a nyelvtankönyvek és a szótárok nem teljesek és pontatlanok, ezért szövegekből olvasgatva kell helyre tenned a fogalmakat a fejedben.
Egy tipikus szótár felsorolja egy szó lehetséges fordításait, de semmit nem, vagy keveset ( és főleg már jól tudók számára használhatót) mond arról, hogy mikor melyiket kell választani.
Ha jó programot akarsz írni, neked kell ezt a szótárt elkészítened, de még az emberi célra készült, viszonylag teljesnek mondható jó szótár elkészítése is hatalmas munka.
Ez már önmagában egy szinte leküzdhetetlen gát egy embernek.
Ugyanez a helyzet a nyelvtannal.
És akkor jön a szemantika. A fordításhoz bizonyos esetekben igenis meg kell legalább részlegesen érteni a szöveget, mert ezeket a helyzeteket igen nehéz formális szabályokkal kezelni.

Előzmény: nadamhu (23)
nadamhu Creative Commons License 2004.05.08 0 0 26
Éppen arról beszéltem, hogy az alanyi és tárgyi ragozás helyes megválasztásához tudnod kell a tárgy determinánsát (mi is erre a magyar szaksző?)
Én is csak úgy ismerem, hogy determináns. Egyelôre csak angolról fordítok magyarra, és hát sajnos egy csomó speciálisabb nyelvtani esetet nem úgy ismer fel a program, ahogy kellene.
Előzmény: polites (24)
polites Creative Commons License 2004.05.08 0 0 25
Ja bocs, ha a programod csak angolról magyarra megy, akkor tárgytalan a példa.
Előzmény: polites (24)
polites Creative Commons License 2004.05.08 0 0 24
Nem kell bizonyíték, én elhiszem bemondásra is.

Éppen arról beszéltem, hogy az alanyi és tárgyi ragozás helyes megválasztásához tudnod kell a tárgy determinánsát (mi is erre a magyar szaksző?). Bonyolultabb mondatoknál ez nem könnyű.

Ezzel mit csinál a programod (a három "az"-zal):
"Akit keresek, az az az ember, aki ismeri őt."?

Előzmény: nadamhu (22)
nadamhu Creative Commons License 2004.05.08 0 0 23
Hát igen.
A FAHQT örökké kisikló vágyálma. :)
(Fully Automatic High Quality Translation

én kishitů vagyok, és csak a lehetô legjobbra törekszem, amit ki tudok hozni. Nem a tökéletességre.

De nagyon érdekes.
én úgy tůnik, hogy felraknám rá az életemet, ha a finanszírozás meglenne rá.

Előzmény: polites (21)
nadamhu Creative Commons License 2004.05.08 0 0 22
Nem ilyen egyszerů a dolog.

Az ilyen mondatoknál, mint ezek, királyul megy:

I love a girl. -> Egy lányt szeretek.
I love this girl -> Ezt a lányt szeretem.

Bizonyítéknak bepaste-olhatom a logját bármelyiknek. A gond ott van, hogy egy picit bonyolultabb dolgoknál a program 'elveszti a fonalat'. De hát 2 évvel ezelôtti ötleteim most jutottak el a megvalósításig... Ma már lennének jobb ötleteim is... Kegyetlen sok meló egy embernek, munkahely mellett...

Előzmény: polites (19)
polites Creative Commons License 2004.05.08 0 0 21
"Szóval ezen ügyködök fanatikusan évek óta minden este"

Hát igen.
A FAHQT örökké kisikló vágyálma. :)
(Fully Automatic High Quality Translation)

Mindig elérhetőnek látszik, de még évtizedek múlva sem lesz meg.
De nagyon érdekes.

Előzmény: nadamhu (20)
nadamhu Creative Commons License 2004.05.08 0 0 20
Bocs a terjengôsségért. Ha valaki megpróbálná "elemezni", itt egy egyszerůbb fordítás logja:


--------------------------------------------
Input text:
I park in the park.
Tokens:
I
park
in
the
park
.
Tokens created. time:0
ALTMORFS
[i 0 0 1]
ALTMORFS
[park 1 0 0]
ALTMORFS
[in 1 0 0]
ALTMORFS
[the 1 0 0]
ALTMORFS
[park 1 0 0]
ALTMORFS
seqbegup:1
s parsing ready! combs:898 real combs:259
-------Best meaning possibility-------:
ST rel=V_PARK state=101 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[4] crturn=4 points=3
SLOT SLOT_SUBJECT
E noun=N_I det=[S 0 ] state=2407 bwu:false beg=[0] end=[0] crturn=1 points=1
SLOT SLOT_IN
E noun=N_PARK det=[THE 0 ] state=1 bwu:false beg=[3] end=[4] crturn=2 points=2
deep translation done. time:40

Hungarian tree:
ST rel=VH_PARKOL state=101 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[4] crturn=4 points=3
SLOT SLOT_ALANY
E noun=NH_EEN det=[S 0 ] state=2407 bwu:false beg=[0] end=[0] crturn=1 points=1
SLOT SLOT_BAN
E noun=NH_PARK det=[THE 0 ] state=1 bwu:false beg=[3] end=[4] crturn=2 points=2
hungarian tree generation done. time:50
Hungarian morphem sequence:
A park +ban parkol +e1
hun m. g. workspace creation done. time:50
hun m. g. firerules done. turns:2 time:70
hungarian morhological generation done. time:70
Hungarian word sequence:
A parkban parkolok
Hungarian output:
A parkban parkolok
seqbegup:1
placeholders:

Előzmény: nadamhu (17)
polites Creative Commons License 2004.05.08 0 0 19
Úgy látom, hogy az alanyi és tárgyi ragozást még nem igazán kezeli jól a programod, azokat pedig nem tudod jól kezelni, ha a névelőt és egyéb determinánsokat nem kezeled jól.
Előzmény: nadamhu (17)
polites Creative Commons License 2004.05.08 0 0 18
Szemantikától eltekintve is, Chomsky generatív rekurzív modelljei jók a rögzített szórendű, izoláló nyelvek kezelésére, de nem annyira jók a szabad szórendű erősen toldalékoló nyelvekre, bár magát a toldalékolást is általában le lehet írni hasonlóan.
Előzmény: Szőke Dibuk (15)
nadamhu Creative Commons License 2004.05.08 0 0 17
Szia Szôke Dibuk!

Azt üzenem MM-nek, hogy: :)

Amit középiskolában tanítanak nyelvészetrôl, az csak amolyan bevezetô dolog. Olyan, mint amikor egy általános iskolai technika tanár programozást tanít. A gyerekek kapnak valami képet, hogy ilyen is van, meg van fônév, meg melléknév, meg ige, meg van alany, meg tárgy, meg ilyenek. De ez nem az a szint, amivel valamit kezdeni is lehet.

Már 1-2 éve bütykölök egy angol-magyar fordító programot. Elôször nekem is az volt a véleményem mint neked; a kezembe kerülô nyelvtankönyvek felszínesek voltak. Azonban közben kiderült, hogy csak én jártam csukott szemmel, mert van ennek komolyabb irodalma is, csak én nem vettem észre. Szóval most kezdek mindenféle nyelvészeti könyveket megvásárolni, és olvasgatni. Amennyit látok belôle: Ez egy komoly tudomány, nyitott kérdésekkel, csak ez nem jut el az emberekhez a középiskolai oktatáson keresztül.

A számítógépes nyelvészetnek szerintem nem a mondat szintaktikáját, hanem a _szemantikáját_ kellene modelleznie. A mondatok értelme már általában sokkal egyszerűbb jószág a nyelvek szintaktikájánálm és objektumorientált szemmel is sokkal megközelíthetőbbek.
Ezt is így gondoltam mint te, de nem egészen ëgy van: Chomsky szerintem nem ragadt le annál, amit nekünk a můegyetemen tanítottak, csak szerintem nekünk azért nyomtak csak ennyit, mert elsôsorban a mesterséges számítógépes nyelvekre helyezték a hangsúlyt. Majd késôbb tudok csak nyilatkozni: Most rendeltem meg egy könyvet ami Chomsky újabb munkásságával is foglalkozik.
Azonkívül a szemantikát is kutatják a nyelvészek rendesen.
Az az egészben a szép, hogy nyitottak a kapuk: ha te jobbat tudsz, mint mások, írhatsz az alapján egy fordítót, és máris tiéd a pénz/hírnév: nem kellenek ide kapcsolatok...

Végül ízelítônek berakok egy részletet az 1 hónapon belül megjelenô kezdetleges fordítóprogramom log file-jából.
Szóval ezen ügyködök fanatikusan évek óta minden este: (Azért sajnos nem mindent fordít ilyen jól... Már jó nagy hackelés az egész, (pedig nem annak indult), ha kiadom akkor elkezdek a következô verzión dolgozni, amit egy alapos elméleti alapozás fog megelôzni.)

Bemenet:
As Leibniz said, without math you cannot really understand philosophy, without philosophy you cannot really understand mathematics, and with neither of them, you can't really understand a thing!

Kimenet:
Ahogy Leibniz mondott, igazán nem tudsz filozófiát érteni matek nélkül, igazán nem tudsz matematikát érteni filozófia nélkül, és igazán nem tudsz egy dolgot érteni közülük semelyikkel

Log.:


--------------------------------------------
Input text:
As Leibniz said, without math you cannot really understand philosophy, without philosophy you cannot really understand mathematics,

and with neither of them, you can't really understand a thing!
Tokens:
As
Leibniz
said
,
without
math
you
cannot
really
understand
philosophy
,
without
philosophy
you
cannot
really
understand
mathematics
,
and
with
neither
of
them
,
you
can
not
really
understand
a
thing
!
Tokens created. time:10
ALTMORFS
[as 0 0 1]
ALTMORFS
[leibniz 1 0 3]
ALTMORFS
[say 1 0 0] [+ed 0 0 0]
ALTMORFS
[, 0 0 0]
ALTMORFS
[without 1 0 0]
ALTMORFS
[math 1 0 0]
ALTMORFS
[you 1 0 0]
ALTMORFS
[can 1 0 0] [not 0 0 0]
ALTMORFS
[real 1 0 0] [+ly 0 0 0]
ALTMORFS
[understand 1 0 0]
ALTMORFS
[philosophy 1 0 0]
ALTMORFS
[, 0 0 0]
ALTMORFS
[without 1 0 0]
ALTMORFS
[philosophy 1 0 0]
ALTMORFS
[you 1 0 0]
ALTMORFS
[can 1 0 0] [not 0 0 0]
ALTMORFS
[real 1 0 0] [+ly 0 0 0]
ALTMORFS
[understand 1 0 0]
ALTMORFS
[mathematics 1 0 0]
ALTMORFS
[, 0 0 0]
ALTMORFS
[and 0 1 0]
ALTMORFS
[with 1 0 0]
ALTMORFS
[neither 1 0 0]
ALTMORFS
[of 1 0 0]
ALTMORFS
[them 1 0 0]
ALTMORFS
[, 0 0 0]
ALTMORFS
[you 1 0 0]
ALTMORFS
[can 1 0 0]
ALTMORFS
[not 1 0 0]
ALTMORFS
[real 1 0 0] [+ly 0 0 0]
ALTMORFS
[understand 1 0 0]
ALTMORFS
[a 1 0 0]
ALTMORFS
[thing 1 0 0]
ALTMORFS
seqbegup:1
s parsing ready! combs:36135 real combs:6344
-------------------------------
S-parsing done. time:480

-------Best meaning possibility-------:
ST rel=V_AS_AHOGY state=3001 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[32] crturn=9 points=11
Composites:
ST rel=V_COMMA state=3001 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[1] end=[10] crturn=8 points=4
Composites:
ST rel=V_SAY state=4119 negated=false mood=DECLARATIVE time=PAST comp=COMP_BASIC modifier=MOD_NOTHING beg=[1] end=[2] crturn=2 points=1
SLOT SLOT_SUBJECT
E noun=N_UPN upn=leibniz det=[S 0 ] state=0 bwu:true beg=[1] end=[1] crturn=1 points=1
ST rel=V_UNDERSTAND state=44101 negated=true mood=DECLARATIVE time=CAN comp=COMP_BASIC modifier=MOD_NOTHING beg=[4] end=[10] crturn=7 points=3
SLOT SLOT_SUBJECT
E noun=N_YOU det=[S 0 ] state=403 bwu:false beg=[6] end=[6] crturn=1 points=1
SLOT SLOT_OBJECT
E noun=N_PHILOSOPHY det=[S 0 ] state=0 bwu:false beg=[10] end=[10] crturn=1 points=1
SLOT SLOT_WITHOUT
E noun=N_MATH det=[S 0 ] state=0 bwu:false beg=[5] end=[5] crturn=1 points=1
Substatements:
ST rel=A_REAL state=3 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
ST rel=V_AND state=3001 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[12] end=[32] crturn=8 points=7
Composites:
ST rel=V_UNDERSTAND state=44101 negated=true mood=DECLARATIVE time=CAN comp=COMP_BASIC modifier=MOD_NOTHING beg=[12] end=[18] crturn=7 points=3
SLOT SLOT_SUBJECT
E noun=N_YOU det=[S 0 ] state=403 bwu:false beg=[14] end=[14] crturn=1 points=1
SLOT SLOT_OBJECT
E noun=N_MATHEMATICS det=[S 0 ] state=0 bwu:false beg=[18] end=[18] crturn=1 points=1
SLOT SLOT_WITHOUT
E noun=N_PHILOSOPHY det=[S 0 ] state=0 bwu:false beg=[13] end=[13] crturn=1 points=1
Substatements:
ST rel=A_REAL state=3 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
ST rel=V_UNDERSTAND state=44101 negated=true mood=DECLARATIVE time=CAN comp=COMP_BASIC modifier=MOD_NOTHING beg=[21] end=[32] crturn=7 points=4
SLOT SLOT_SUBJECT
E noun=N_YOU det=[S 0 ] state=403 bwu:false beg=[26] end=[26] crturn=1 points=1
SLOT SLOT_OBJECT
E noun=N_THING det=[A 0 ] state=1 bwu:false beg=[31] end=[32] crturn=2 points=2
SLOT SLOT_WITH
E noun=N_THEY det=[S 13 ] state=403 bwu:false beg=[22] end=[24] crturn=2 points=1
Substatements:
ST rel=A_REAL state=3 negated=false mood=DECLARATIVE time=PRESENT comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
deep translation done. time:511

Hungarian tree:
ST rel=VH_AHOGY state=3001 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[0] end=[32] crturn=9 points=11
Composites:
ST rel=VH_VESSZO state=3001 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[1] end=[10] crturn=8 points=4
Composites:
ST rel=VH_MOND state=4119 negated=false mood=KIJELENTO time=MULT comp=COMP_BASIC modifier=MOD_NOTHING beg=[1] end=[2] crturn=2 points=1
SLOT SLOT_ALANY
E noun=NH_UPN det=[S 0 ] state=0 bwu:true beg=[1] end=[1] crturn=1 points=1
ST rel=VH_TUD state=1 negated=true mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[4] end=[10] crturn=7 points=3
SLOT SLOT_ALANY
E noun=NH_TE det=[S 0 ] state=403 bwu:false beg=[6] end=[6] crturn=1 points=1
SLOT SLOT_TARGY
E noun=NH_FONIGENEV det=[S 0 ] state=0 bwu:false beg=[-1] end=[-1] crturn=0 points=0
ST rel=VH_EERT state=44101 negated=false mood=KIJELENTO time=FONIGENEV comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
SLOT SLOT_TARGY
E noun=NH_FILOZOOFIA det=[S 0 ] state=0 bwu:false beg=[10] end=[10] crturn=1 points=1
SLOT SLOT_NEELKEUL
E noun=NH_MATEK det=[S 0 ] state=0 bwu:false beg=[5] end=[5] crturn=1 points=1
Substatements:
ST rel=AH_VALOOS state=3 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
ST rel=VH_EES state=3001 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[12] end=[32] crturn=8 points=7
Composites:
ST rel=VH_TUD state=1 negated=true mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[12] end=[18] crturn=7 points=3
SLOT SLOT_ALANY
E noun=NH_TE det=[S 0 ] state=403 bwu:false beg=[14] end=[14] crturn=1 points=1
SLOT SLOT_TARGY
E noun=NH_FONIGENEV det=[S 0 ] state=0 bwu:false beg=[-1] end=[-1] crturn=0 points=0
ST rel=VH_EERT state=44101 negated=false mood=KIJELENTO time=FONIGENEV comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
SLOT SLOT_TARGY
E noun=NH_MATEMATIKA det=[S 0 ] state=0 bwu:false beg=[18] end=[18] crturn=1 points=1
SLOT SLOT_NEELKEUL
E noun=NH_FILOZOOFIA det=[S 0 ] state=0 bwu:false beg=[13] end=[13] crturn=1 points=1
Substatements:
ST rel=AH_VALOOS state=3 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
ST rel=VH_TUD state=1 negated=true mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[21] end=[32] crturn=7 points=4
SLOT SLOT_ALANY
E noun=NH_TE det=[S 0 ] state=403 bwu:false beg=[26] end=[26] crturn=1 points=1
SLOT SLOT_TARGY
E noun=NH_FONIGENEV det=[S 0 ] state=0 bwu:false beg=[-1] end=[-1] crturn=0 points=0
ST rel=VH_EERT state=44101 negated=false mood=KIJELENTO time=FONIGENEV comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
SLOT SLOT_TARGY
E noun=NH_DOLOG det=[A 0 ] state=1 bwu:false beg=[31] end=[32] crturn=2 points=2
SLOT SLOT_VAL
E noun=NH_OEK det=[S 13 ] state=403 bwu:false beg=[22] end=[24] crturn=2 points=1
Substatements:
ST rel=AH_VALOOS state=3 negated=false mood=KIJELENTO time=JELEN comp=COMP_BASIC modifier=MOD_NOTHING beg=[-1] end=[-1] crturn=-842150451 points=0
hungarian tree generation done. time:521
Hungarian morphem sequence:
Ahogy upn_Leibniz mond +mult +e3 , valós +an nem tud +e2 filozófia +targy ért +ni matek nélkül , valós +an nem tud +e2 matematika +targy ért +ni filozófia nélkül , és valós +an nem tud +e2 egy dolog +targy ért +ni ôk közül semelyik +val
hun m. g. workspace creation done. time:521
hun m. g. firerules done. turns:3 time:771
hungarian morhological generation done. time:771
Hungarian word sequence:
Ahogy Leibniz mondott , igazán nem tudsz filozófiát érteni matek nélkül , igazán nem tudsz matematikát érteni filozófia nélkül , és igazán nem tudsz egy dolgot érteni ôk közül semelyikkel
Hungarian output:
Ahogy Leibniz mondott, igazán nem tudsz filozófiát érteni matek nélkül, igazán nem tudsz matematikát érteni filozófia nélkül, és igazán nem tudsz egy dolgot érteni közülük semelyikkel
seqbegup:1
placeholders:

Előzmény: Szőke Dibuk (15)
polites Creative Commons License 2004.05.08 0 0 16
"A magyarra jellemző, hogy bizonyos dolgokat szeret elhagyni a mondatokból. Attól azonban, hogy valamit eltüntet a szintaktikából, a szemantikában még ott marad. Ezt egyedül a rejtett alanynál vallja is be. Amikor azt mondom: "Iskolába ment." itt az alany az "ő", annak ellnére, hogy ilyen szó nem szerepel a mondatban.

Értelmes nyelvben, például németben: "Er gang in die Schule." az "Er" az alany. Ez tehát egy olyan dolog, amit a magyar nyelvtan úgy magyaráz, ahogy szerintem kell."

Magyarra jellemző, ... értelmes nyelvben... :)))

Meg a latinra jellemző, meg a görögre jellemző, meg a spanyolra jellemző, meg mindazokra az "értelmetlen" nyelvekre jellemző, amelyeknek teljes, beszédben is kiejtett igeragrendszerük van és ezért szükségtelen kitenni az alany szerepét betöltő névmást, hacsak nem nyomatékosítani akarunk. :)

A névszói állítmány mítoszáról én is azt gondolom, hogy egyszerűen rosszul kezelték a default állítmányt. Más módokban, időkben és személyekben ott van, csak a kijelentő mód, jelen idő, harmadik személyében hiányzik.

De ez nem is magyar specifikus, az oroszban ugyanez a helyzet, sőt ott minden számban elhagyják a létigét az ilyen mondatokban.

Előzmény: Szőke Dibuk (15)
Szőke Dibuk Creative Commons License 2004.05.08 0 0 15
Szerintem MM (azt üzeni, jövő héten újra itt) csak a magyar mondatelemzésre gondolt. Ezt támasztja alá az is, hogy azt magyarázta, az ilyen magyar nyelvtani mondatelemzéssel kezelhetetlen mondatokat le lehet kezelni az idegen nyelvre fordítással.

A magyar nyelvi mondatelemzés trágya voltáról amúgy egy hosszabb hozzászólást is írhatnék, leginkább az ún. "rejtett alany"-on látszik, hogy aki kitalálta, vagy életében nem ismert egyetlen nyelvet sem, vagy úgy gondolta, neki mindenáron meg kell ideologizálni a hülyeségeket.

A magyarra jellemző, hogy bizonyos dolgokat szeret elhagyni a mondatokból. Attól azonban, hogy valamit eltüntet a szintaktikából, a szemantikában még ott marad. Ezt egyedül a rejtett alanynál vallja is be. Amikor azt mondom: "Iskolába ment." itt az alany az "ő", annak ellnére, hogy ilyen szó nem szerepel a mondatban.

Értelmes nyelvben, például németben: "Er gang in die Schule." az "Er" az alany. Ez tehát egy olyan dolog, amit a magyar nyelvtan úgy magyaráz, ahogy szerintem kell.

Ellenben nézzük ezt a mondatot: "Én leszek fejedelmetek." Itt most szegény problémafelvető nem tudta eldönteni, hogy a "fejedelmetek" az most állítmány vagy birtokos szerkezet. Idegennyelven rögtön látszik a lényeg: "I will be your king." Egyszerűn már ordít a szavakról a mondatszerkezet.

De van más példa is. Ilyen mondat például: "Az iskola az iskola." Erről anno nyelvtantanárom azt mondta, hogy ezt a mondatot még senkinek sem sikerült elemeznie, illetve többféleképpen is lehet. Persze, hogy többféleképpen lehet. Németül már nem.

Na de a LÉNYEG!:
Ez nem azért van, mert a magyar nyelvvel bármi gond lenne. A magyar nyelv teljesen jól oldja meg a dolgokat, jobban, mint nyugatiak, mert hajlandó elhagynia mondatokból a fölösleges szavakat. A magyar mondatelemzés trágya! Már eleve azért is, mert az állítmánynak _mindig_ igének kell lennie. Magyar nyelvtanban nem. "Az alma piros." Itt a "piros" az állítmány, de ha átrakjuk a mondatot E/2-be, akkor rögtön átviláglik a lényeg, hogy itt NEM a "piros" az állítmány, hanem a "van", csak a magyar nyelvészek a rejtett alanynál alkalmazott huszárvágást az állítmány esetében már nem voltak hajlandóak alkalmazni.

Az meg ugyebár programozói szemmel elég nagy butaság, hogy a mondat E/3-ból E/2-be rakása rögtön szerkezetváltozással is járjon. Ha természetes nyelvi interfészt akarnék írni, akkor eszembe nem jutna egy ilyen idióta elméletet használni fel hozzá.

Egyébként Chomskyt nem csípem, mert szerintem a számítógépes nyelvészet véglegesen halottá vált azzal, hogy a nyelvet _kizárólag_ a szintaktika modellezésével próbálta kezelni. Persze, hogy bebukott, mert egyszerűen nem vett tudomást a szemantikáról. Minden nyelvtan, még a 0-ad osztályú nyelvtanok is csak a szintaktikával foglalkoznak, nem csoda, hogy elméleti alapon kezelhetetlenek. A fizikusok is leragadtak volna már többszáz éve a kinetikus gázelméletnél, ha egyesével számolgatták volna a molekulák perdületét és mozgásvektorait.

A számítógépes nyelvészetnek szerintem nem a mondat szintaktikáját, hanem a _szemantikáját_ kellene modelleznie. A mondatok értelme már általában sokkal egyszerűbb jószág a nyelvek szintaktikájánálm és objektumorientált szemmel is sokkal megközelíthetőbbek.

Persze mindez csak egy ismertség nélküli senki kritikája, természetesen eszembe sem jutna megkérdőjelezni az ilyen hatalmas elődök, mint Chomsky élete munkáját... blahblah... :-)))

Előzmény: nadamhu (12)
polites Creative Commons License 2004.05.08 0 0 14
Összetett állítmány.

http://www.c3.hu/~nyelvor/period/1241/124105.htm

(Lásd a 7. pontot)

Előzmény: meki (8)
nadamhu Creative Commons License 2004.05.07 0 0 13
Jó, annyiból igazad van, hogy faszság ráerôltetni azokra, akiket nem érdekel, és nem is lesz rá szüksége.
Előzmény: Muster Mark (11)
nadamhu Creative Commons License 2004.05.07 0 0 12
Hogy mekkora faszság ez a mondatelemzés!
Informatikus létedre ilyet mondani!:) Ha természetesnyelvi felületet akarnál írni mire mennél mondatelemzés nélkül?
Na persze NEKED faszság, mert TE nem foglalkozol ilyesmivel.
Előzmény: Muster Mark (11)

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!