Keresés

Részletes keresés

Szindbad76 Creative Commons License 2004-08-16 11:24:07 34
Emlitettel korabban olyasmit ha jol emlexem, hogy a valoszinusegi, statisztikai vizsgalaton alapulo nyelv-elemzoket nem tartod jo iranynak. Megkerdezhetem, hogy miert?
A hozzászólás:
nadamhu Creative Commons License 2004-08-16 11:03:59 32

Szia, nyaralni voltam, ezért reagálok ilyen későn.

 

Jelenleg hol tartanak a profik a művelt nyugaton? A mo-i helyzetet leírtad.

Túl sok ismeretem nincs ezen a téren. Egyszer egy Németországi cég megvett nekünk egy nem túl olcsó Német->Angol fordítóprogramot (Systran). A fordítás éppen csak hogy érthető volt (már ahol érthető volt): amennyire én tudom, még a művelt nyugaton is csak alacsony minőségű, szövegértést támogató fodítások születnek.

 

Meddig fogsz tenmagad eljutni? Mi a célod, mit látsz reálisnak a magad esetében.

Amit eddig csináltam (1.* verzió), azt egy viszonylag ad-hoc 'prototípusnak' tekintem, ami segített abban, hogy valamennyire megismerjem a feladat minden részét, de egyiket sem túl mélyen. (Kivéve a morfológiát, ott leástam addig, hogy 'megoldottam' a feladatot.) Ezt kb. úgy lehet tekinteni, mintha építettem volna egy viskót.

Már készítem a 2.0-ás verziónak nevezett valamit, ami kevéssé szoftverfejlesztésnek indul: dokumentumokat írogatok, kísérleteket végzek kisebb korpuszokon, modulokat tervezek, nagyon sok kérdést nyitva hagyok, alternatív megoldásokon gondolkodom. Eddig mindenáron egy működő fordítót akartam magam előtt látni minél gyorsabban, de most, hogy már látom, hogy ez valamilyen szinten megoldható, megelégszem azzal, ha mondjuk egy év után még mindig csak egy angol nyelvtani elemzőm van, de az 'olyan'. Szóval olyan ez, mintha egyedül kezdenék építeni egy piramist, de ezt semmiképpen nem egyedül akarom majd végigcsinálni, időközben keresek majd társakat. Ha van kedved ilyesmivel foglalkozni, téged is szívesen látlak majd, ez egy hosszútávú projekt lesz.

Érdekes kérdés a szemantika, de mint említettem, a jelenlegi fordítómon még szintaktikai szinten is lehetne bőven javítani. Első részfeladatként tehát egy viszonylag igényes angol szintaktikai elemző írását tűztem ki célul. (Olyat, ami legalább több alternatíva között egy esetként felismeri a helyes szerkezetét minden, az 500 oldalas 'Gyakorlati Angol Nyelvtan' című könyv példamondatának. :)

(Sőt, ennél többre van szükség, mert ezek e példamondatok bizonyos szempontból még mindig túl szabályosak.)

Előzmény:
Aller-gen-etikus Creative Commons License 2004-08-06 17:22:39 30
Szia Nadamhu!

 

Garázs, összetákolt

 

A garázs volt inkább a fontos mintsem az összetákol. Akkor pontosítok:

az a kor járt le, amikor egy két ember gazdasági potenciál, háttér nélkül összehajol és minimális eszközigénnyel egy kereskedelmileg sikeres applikációt létrehoz. Például olyan jellegűeket mint az Excel, Winword, stb.

 

Azt ugye belátjuk, hogy egy (természetes nyelv) fordító komplexitásában nem hasonlítható egyetlen ilyen jellegű applikációhoz sem. 

Az applikáció használói hajlandóak voltak a számukra újat elfogadni és megtanulni.

Fordítás esetében a legkisebb eltérésen, szokatlanságon fanyalogni fognak.

 

A fordítónál a nyelvi háttér iszonyúan komplex modellt feltételez.

 

Magát a programozási részt nem tartom akkora kihívásnak mint amekkora kihívást a nyelvészeti, és nyelvművelői munkák felhasználásával a fordítói modell megalkotása jelent.

 

Nem véletlen a nyelvművelői terület említése részemről, a köznyelvi, vagy az irodalmi színvonalú output mint kívánalom esetén ez elkerülhetetlen. 

 

Egy jó fordítónak pl. adaptívnak is kellene lennie, fel kell ismernie például, hogy valaki bizonyos rövidítéseket használ,  pl. a „hogy” helyett csak „h”-t. Az esetleges nem értelemzavaró félregépeléseket.

Azt is ha az input szöveg valamelyik szabálynak nem felel meg, de a mondanivalója nem kétséges, ha ember fordít.

Új összetételt kezdek el használni mint pl. te tetted az alfeladat-tal.

 

(Jó ezeket persze egynyelvű emberi beavatkozással meg lehet oldani és már csak szabályos szöveg kerül a fordítóra.)

fordítási kategóriák

 

A kategóriák felvázolása után hiányzott a kérdésem, amit végülis részben meg megválaszoltál.

Akkor most teszem fel azokat a kérdéseimet, amik akkor kimaradtak. Ebben vagy ehhez hasonló koordináta, kategória rendszerben hogy látod a gépi fordítás jelenét, jövőjét.

 

Jelenleg hol tartanak a profik a művelt nyugaton? A mo-i helyzetet leírtad.

Van-e kitűzött cél? Hol tartanak ott ahol van pénz, paripa és fegyver. Ismered vannak e ezen a területen?

 

Meddig fogsz tenmagad eljutni? Mi a célod, mit látsz reálisnak a magad esetében.

 

Van két kérdésem is.

Milyen modelled van az adaptivitás illetve a kontextus kezelésére? 

 

Azt ugye beláthatjuk, hogy nem lehet valami olyan felfedezésre, durranásra várni, számítani, ami alapjaiban megrengetné ezt a területet, és egyik napról születnének a használhatóbbnál használhatóbb a fordítók.

 

A nyelvek ilyen, olyan szinten le vannak írva :-). 

Nyelvművelés is megfogalmazta szabályszerűségekbe és kivételekbe foglalva a maga elvárásait a köznyelvről és az irodalmi nyelvről.  

Programozási eszközök sem jelentenek akadályt. 

Nem beszélve a gépi kapacitásokról.

Ez nem egy új téma, már húsz évvel ezelőtt is írtak róla.

Igény is van rá

 

Mégsem vehetek le az üzlet polcáról ilyen terméket, a következő egy két

év(tized)ben) biztosan.

 

Lehet, hogy a fordítói lobby, mafffia akadályozza ezt is mint a nullponti energia kicsatolását a olajlobby? :-)))

 

agglutináció

Elismerem, hogy a nyelvünk erősen agglutináló jellege, csak egy behatárolt többletfeladatot támaszt a fordítóval szemben. Ez valóban csak egy alfeladat, ez esetben a tökéletes megoldás sem kizárt. 

 

hozzáértésem

Egyébként miből, melyik mondatomból olvastad ki, hogy a laikusi szintnél magasabbat vindikálok magamnak?

 

Fa, erdő, dzsungel

Nem hiszem, hogy én ellendrukkered lettem volna a levelemben, sőt.

Inkább nagyra értékelem, ezt a fajta hozzáállást. Azt hiszem, csak az elérhető cél távoliságának és az odavezető út göröngyösségének megítélésében van köztünk hangyányi különbség.

 

Ne vedd fenyegetésnek, de a vigyázó szememet e fórumra és ameddig publikus a fordítódra vetem.

 

üdvözlettel:

aller

 

 

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!