Keresés

Részletes keresés

nadamhu Creative Commons License 2004-08-16 12:29:00 35

A statisztikai módszerek jók lehetnek bizonyos részfeladatokra. Pl. teszemazt van egy nyelvtani elemződ, ami nem tud dönteni 2 elemzési fa alternatíva között. Ekkor pl. statisztikai módszert is alkalmazhatunk annak eldöntésére, hogy melyik fa a jobb. (melyikhez hasonló fordult elő már a korpuszban).

Én azzal nem értek egyet, amikor nincs igazán nyelvi modellünk, és az egész feladatot (angol szövegtől magyar szövegig) statisztikai módszerrel akarjuk megfogni.

Szerintem vannak dolgok, amiről sokat tudunk, ezért érdemes direktbe beépíteni a rendszerbe (ilyen pl. a szintaktika, a morfológia), vannak területek, ahol bizonytalanabban tudunk szabályokat formalizálni, ott érdemes statisztikai módszerrel próbálkozni. De azokat a statisztikai fordításokat, amelyeket a nyelv felszínén (az elemzetlen szó sorozaton) végeznek, zsákutcának látom: ideig óráig el akarják kerülni, hogy okos modellt építsenek, (kezdetben elég szép eredmények vannak) így viszont túl bonyolult feladatot akarnak megoldatni tisztán statisztikai úton, egy bizonyos minőségen nem lehet túllépni így szerintem. Ezt kb. így látom más komplex feladatok esetén is. Pl. ha egy hangfelismerőt írsz, ami megmondja, hogy milyen állat hangját halljuk az erdőben, elég lehet egy statisztikai elemző. Ha egy olyan robotot kell csinálni, ami az erdőben 'él', táplálékot szerez, menekül a ragadozók elől, ahhoz ma jobb híján valamiféle moduláris rendszert terveznék, amiben részfeladatokra lehet, hogy használnék statisztikai módszereket, de nem az egész feladatra: nem az inputon végzett statisztikai elemzés döntené el, hogy hogyan mozgassuk a szervomotorokat.

A hozzászólás:
Szindbad76 Creative Commons License 2004-08-16 11:24:07 34
Emlitettel korabban olyasmit ha jol emlexem, hogy a valoszinusegi, statisztikai vizsgalaton alapulo nyelv-elemzoket nem tartod jo iranynak. Megkerdezhetem, hogy miert?
Előzmény:
nadamhu Creative Commons License 2004-08-16 11:03:59 32

Szia, nyaralni voltam, ezért reagálok ilyen későn.

 

Jelenleg hol tartanak a profik a művelt nyugaton? A mo-i helyzetet leírtad.

Túl sok ismeretem nincs ezen a téren. Egyszer egy Németországi cég megvett nekünk egy nem túl olcsó Német->Angol fordítóprogramot (Systran). A fordítás éppen csak hogy érthető volt (már ahol érthető volt): amennyire én tudom, még a művelt nyugaton is csak alacsony minőségű, szövegértést támogató fodítások születnek.

 

Meddig fogsz tenmagad eljutni? Mi a célod, mit látsz reálisnak a magad esetében.

Amit eddig csináltam (1.* verzió), azt egy viszonylag ad-hoc 'prototípusnak' tekintem, ami segített abban, hogy valamennyire megismerjem a feladat minden részét, de egyiket sem túl mélyen. (Kivéve a morfológiát, ott leástam addig, hogy 'megoldottam' a feladatot.) Ezt kb. úgy lehet tekinteni, mintha építettem volna egy viskót.

Már készítem a 2.0-ás verziónak nevezett valamit, ami kevéssé szoftverfejlesztésnek indul: dokumentumokat írogatok, kísérleteket végzek kisebb korpuszokon, modulokat tervezek, nagyon sok kérdést nyitva hagyok, alternatív megoldásokon gondolkodom. Eddig mindenáron egy működő fordítót akartam magam előtt látni minél gyorsabban, de most, hogy már látom, hogy ez valamilyen szinten megoldható, megelégszem azzal, ha mondjuk egy év után még mindig csak egy angol nyelvtani elemzőm van, de az 'olyan'. Szóval olyan ez, mintha egyedül kezdenék építeni egy piramist, de ezt semmiképpen nem egyedül akarom majd végigcsinálni, időközben keresek majd társakat. Ha van kedved ilyesmivel foglalkozni, téged is szívesen látlak majd, ez egy hosszútávú projekt lesz.

Érdekes kérdés a szemantika, de mint említettem, a jelenlegi fordítómon még szintaktikai szinten is lehetne bőven javítani. Első részfeladatként tehát egy viszonylag igényes angol szintaktikai elemző írását tűztem ki célul. (Olyat, ami legalább több alternatíva között egy esetként felismeri a helyes szerkezetét minden, az 500 oldalas 'Gyakorlati Angol Nyelvtan' című könyv példamondatának. :)

(Sőt, ennél többre van szükség, mert ezek e példamondatok bizonyos szempontból még mindig túl szabályosak.)

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!