Keresés

Részletes keresés

Újlaki Creative Commons License 2003-09-07 20:32:10 13
Még csak nem is az a baj, hogy egy szónak több jelentése van; a problémát az a teljes mértékben téves feltételezés, hogy a nyelv alapegysége a szó. Nem igaz, a nyelv alapegysége a kifejezés, esetleg a teljes mondat.

Ha el is fogadnánk, hogy a szó az alapegység, és a nyelvet le lehet írni egy szótárral és egy véges szabályhalmazzal, akkor is az a probléma, hogy ahány beszélő és ahány hallgató, annyi különböző nyelv van, azaz annyi különböző szótár és nyelvtan. A fordítás mindig attól függ, hogy ki mondta kinek, és hogy ezt a fordító mennyire képes megérteni és valakinek elmondani.

Ráadásul még akkor is baj van, ha megtaláljuk a végtelen sok közül az adott esetre jól-rosszul alkalmazható szótárt és nyelvtant, ugyanis mind a kettő akár egyetlen közlés során, menet közben is változik. Gondoljunk egy nyelvtanulásra, vagy tárgyalásra, udvarlásra, ahol folyamatosan változik a résztvevők tudása, stratégiája és taktikája, és menet közben dinamikusan ehhez igazítják az éppen használt nyelvet.

nadamhu Creative Commons License 2002-06-03 23:09:37 8
Vagy egy masik jo pelda a szo helyes jelentesenek eldontesere:

A fordítandó angol szöveg:

I dry the plate.
The plate dries.

A lefordított magyar szöveg:

Megszárítom a tányért.
A tányér szárad.

Itt a targy jelenlete donti el a jelentest. Sok igenel mukodik az a rendszerben, hogy bizonyos vonzat jelenlete befolyasolja a jelentest.

nadamhu Creative Commons License 2002-06-03 22:51:39 7
"hogy a legtöbb szónak több jelentése van"
Magad is megygyozodhetsz rola, hogy pl. a 'light' szot mar most is megprobalja igekent, es fonevkent is kezelni:

I light my fire.
The speed of the light.

A lefordított magyar szöveg:

Meggyújtom a tüzemet.
A fény sebessége.

Tehat en pontositanek: A gond nem akkor van, hogy egy szonak tobb jelentese van, hanem akkor, ha ezek a jelentesek nyelvtanilag ugyanabba a kategoriaba tartoznak.
Ekkor is lehet heurisztikat kidolgozni: Kell allapotautomata, ami jegyzi, hogy kab milyen temarol van szo. Igy e szerint probalja az ertelmet kivalasztani. Pl egy politikai szovegnel a 'Board' szo megkapja a 'Tanacs' ertelmet, mig egy gordeszkas szovegnel a 'deszka'-t.
Ilyet a rendszer meg nem tartalmaz, de ezt is tervezem kesoob belerakni.

nadamhu Creative Commons License 2002-06-03 22:31:12 6
A szokincs egyelore csak 3000 alapszobol all.
Ezert fordulnak elo ismeretlen alapszavak is.
A kovetkezo honapokban ezt fel fogjuk tornaszni a tobbszorosere.
Ez egy 1.0 - as verzio, ami remelhetoleg a kezdet kezdete, de mar igy is fel ev munka van benne.
Egy ilyen rendszer elkeszitese nagyon sok idot es munkat igenyel, bizonyos cegek erre tobb tiz embereveket szannak.

Nagyon sok olyan otletem van, amit a jovoben bele fogok tenni a rendszerbe, de IDO-m nem volt ra.

Peldaul a tobb lehetseges nyelvtani reprezentacio kozul most az elsot valasztja, pedig lehetne prioritasokat rendelni az egyes lehetseges szerkezetekhez...

Talan hiba volt kirakni a progit a netre 3000 szoval, szoval most szokincs bovitesi idoszak kovetkezik...

A hozzászólás:
bastyaelvtars Creative Commons License 2002-06-03 22:08:37 5
Na azért illene némi indoklás is a részemről :))

Szóval ha megnézel egy angol (vagy szinte bármilyen) szótárt, abban az látszik, hogy a legtöbb szónak több jelentése van. Soknak akár 10-20 féle. Hogy fogja kiválasztani a program a szöveg tényleges "megértése" nélkül, hogy a több jelentésből éppen melyik illik oda? Minden szó helyére tesztek egy legördülő listát, amiből a felhasználó majd választ? :)

Különösen az olyan szavak esetében, amelyek nyelvtani összefüggéseket képviselnek. Pl. a Dr. lecter példájában, ahol az "on" tartozhat az előtte és az utána álló szóhoz is. És itt a legördülő lista sem megoldás, mert a választól függően teljesen más lesz a magyar mondat szerkezete, szórendje stb.

Szóval szerintem ott a tanulság, hogy ha egy "intelligencia" nem "érti" a mondat jelentését, akkor esélye sincs azt egy másik nyelvre áttenni.

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!