Szia nadamhu!
Nagy fába vágja a fejszéjét az aki egy ilyenre vállalkozik. Mára a garázsban összetákolt számítógépek mintájára az ilyen szoftverek kora is sajnos lejárt.
Néhány fordítási kategóriát felvázolok:
Tartalmát illetően:
- műfordítás
- ujságszöveg fordítása
- szakszöveg fordítása
- hétköznapi szöveg fordítás
- beszélgetések fordítása
Fordítási pontosságát illetően
- teljes értékű
- értelmi
- lényegvisszaadó
- szórakoztató (használhatatlan, nevetünk az output szövegen)
Emberi beavatkozás
Megbízhatóság, garancia
- jogi szöveg,
- hiteles fordítás,
Egyik végletet azaz teljes értékű műfordítás, hitelesítve emberi beavatkozás nélkül.
Másik véglet a szórakoztató célú kategória. Szabadidőben legfeljebb a első szintjéig lehet eljutni.
Gondold csak meg, nem csak neked jutott eszedbe ez, minden országban vannak nyelvtudományi intézetek, vállalkozások ezeknél kézenfekvő, hogy a nyelvi hátterét kidolgozzák s a piacra lépjenek egy ilyen termékkel. Elkéne gondolkozni azon, hogy miért nincs ilyen.
Onogurral értek egyet én is, azaz nem nyelv1-nyelv2 fordítóké a jövő, hanem a nyelv1-ről egy közbülső nyelvre, történik a fordítás. És erről a küzbülső nyelvről kell a nyelv2-re fordítani.
A közbülső entitás nem is csak egy nyelv, hanem egy tudáshalmaz, amit folyamatosan aktualizálni kell.
A topikban eddig csak a nyelvi szempontokat vették figyelembe, az itt viszont nem elég. A világ és a szavak között a szemantika teremt kapcsolatot, itt még az sem elég. Az egyének nyelven kívüli tudását, tapasztalatát is be kellene építeni a fordítóba.
Egy példa:
A tányér ráesett az asztalra és összetört.
Ebben a mondatban a nyelvi elemzés nem mondja meg hogy mi törtött össze.
Általában a tányér (a kisméretű, porcelán vagy üveg) törik össze a (nagyméretű, fa) asztalon. De mi van ha az asztal gyenge és űvegből van és a tányér nehéz és törhetetlen üvegből van.
Ha a tojást ütjük a kőhöz a tojás törik össze, ha a követ ütjük a tojásahoz akkor is a tojás törik össze. Tartja a mondás. Az asztal, tányér viszonylatban ez már nem ilyen egyértelmű.
Természetesen a kontextusból ki lehet következtetni sokmindent.
S maradhat így a mondat, csak nem derül ki hogy mi törött össze.
Ha már olyan nyelvre fordítunk ami nemeket is alkalmaz, és más neme van az asztalnak, mint a tányérnak ott már egyértelműsíteni kell és akkor mi alapján fog dönteni a gépi fordító tudáshalmaz hiányában?
A magyar nyelv pedig az aglutináló jellege folytán még nehezebb helyzetben van a gépi felismerés terén mint pl a fuzionáló, flektáló nyelvek.
Nem beszélve arról, hogy még nem készült mahgyar nyelv tudományos igényű leírása ami nélkül nem teljes a dolog.
Szóval ezzel a példával csak azt akartam, megmutatni, hogy nem elég csak nyelvtani (szintatkika, szemantika, lexikális elemzés, mondattrani szabályok, szófajok) modulokat beépíteni a fordítóba, hanem a világról és annak részeiről való tudást, a felgyülemlett tapasztalatot is bele kell építeni s ebben a tudáshalmazban kutatva kell a fordítónak a helyes választ kiválasztania, így még mestersegéges intelligenciára is szükség lehet, van.
A 22. hozzászólásodból azt látom, hogy még a lexikai fázissal sem végeztél.
Az az érzésem, hogy csak egy-két fát látsz mindössze. S közben nem vetted észre, hogy erdőben vagy, mit erdőben: dzsungelban.
Saját és barátok szórakoztatására természetesen jó móka egy ilyen fordítóval történő játszadozás.
Amennyiben célod használható, eladható termék lenne, szóval ezt nem lehet így kalákában, fusiban létrehozni.
üdvözlettel:
aller