Keresés

Részletes keresés

mmormota Creative Commons License 2003.03.04 0 0 13
Szerintem nagy idők tanui lehetünk, ahogy a programok kezdenek intelligensebbé válni. Ha simán bénázik egy jelenlegi szintű program, az semmi. De majd ha kezd okosabb lenni! Szerintem lesznek majd igazi nagy ötletei, olyanokat fog kitalálni, amire sose gondoltunk volna, el se hisszük, de beesünk tőle az asztal alá! :-)

A jelenlegi programok emberi nyelvről egyből másik emberi nyelvre fordítanak, vagy van egy köztes "gépi eszperantó"? (remélem ki lehet ebből találni, mire gondolok) Ha lenne, az javítaná a magyar esélyeit, kevesebb lenne a specifikus kizárólag a magyarra jellemző munka.

A valószínűleg sokkal könnyebb (egyáltalán nem értek az egészhez) helyesírás ellenőrzés szerintem eljutott odáig, hogy egy kényelmes, jól használható eszköz lett belőle. Persze nem vesz észre mindent, de összességében nagyon kevés elgépelésből eredő hibát enged át.

A Babel Fish netes fordítót néha szoktam használni, elsősorban oroszról angolra. Tele van minden szörnyűséggel, de legalább értek belőle valamit. Valami egész minimálisat tudok még oroszból is, így együtt meg szoktam érteni a lényeget.

A Google forditója hogy érhető el?

slalom Creative Commons License 2003.03.04 0 0 12
Szükségem volt egy profi programra.Vettem kettőt is 8-8ezerért.(Woodston,Diskovery informania beszélő is)Hát beszélni beszél,de amit fordít az röhely.Szerintem kidobott pénz.Csodálom,hogy még nem jelentette fel valaki ezeket a cégeket a fogy véd hivatalnál.
nadamhu Creative Commons License 2003.02.15 0 0 11
>using Werner Heisenberg's uncertainty principle"
>"használó Werner Heisenberg's bizonytalanság >elv"

Ja, bocs itt is elhibazta, es nem vette eszre hogy ha a tulajdonnev 's - re vegzodik akkor a 's-t le kell szedni mint kulon morfemat. Valoszinuleg csak a szotarban megtalalhato fonevekre teszi ezt meg. Hat, azert ez tenyleg nagyon gyenge.

Előzmény: nadamhu (10)
nadamhu Creative Commons License 2003.02.15 0 0 10
Bohr invariably demolished Einstein by using Werner Heisenberg's uncertainty principle."

így fordítja:

"Bohr változatlanul lerombolt Einsteint által használó Werner Heisenberg's bizonytalanság elv

----------------------------
Amennyire meg tudom itelni a szoftver valoszinuleg nem tudta elemezni a teljes mondatot mondatot, csak 3 reszletben reszeit:

"Bohr invariably demolished Einstein"
Bohr változatlanul lerombolt Einsteint

Itt annyit hibazott, hogy nem ismerte fel, hogy a tulajdonnev targykent mindig targyas ragozast vonz a magyarban. (tehat az kellene, hogy lerombolta Einsteint. )

"by"
"altal"

"using Werner Heisenberg's uncertainty principle"
"használó Werner Heisenberg's bizonytalanság elv"

Ha belegondolsz ez igy onmagaban szigoruan nyelvtani szempontbol korrekt lenne, de adott esetben tudjuk, hogy hibas.

Oszinten szolva az en programom felismeri ennek a mondatnak a strukturajat, ami ez:

[allitas] by [ing-es fonevi resz]

de sok ennel bonyolultabbat meg nem, es pl. a 'demolish' es az 'uncertainty' szot sem ismerte a mai napig. Szoval boven van meg mit csinalnom nekem is.

Előzmény: Silan (9)
Silan Creative Commons License 2003.02.15 0 0 9
Például a topiknyitó hozzászólásomban szereplő két angol mondatot sikeresen elemzi a szoftvered? Ha nem, hol téved el?
Előzmény: nadamhu (6)
nadamhu Creative Commons License 2003.02.15 0 0 8
>De elgondolkodtató ugyanakkor, hogy egy profi >program jópár fordítónak elvenné a kenyerét.
Ja, erre meg akartam reagalni.
Szerintem van egy minosegi szint, amit a forditoprogramok addig nem lepnek at, amig nem csinalnak MI-t. Tehat a minosegi forditast meg jo ideig biztosan emberek csinaljak majd.
Előzmény: Biga Cubensis (5)
nadamhu Creative Commons License 2003.02.15 0 0 7
Koszi, vegulis egyelore hobby; bar mar nagyon sok szabadidomet eltoltottem vele.
Termeszetesen az a celom, hogy egyszer kereskedelmi termek legyen belole.
Előzmény: Biga Cubensis (5)
nadamhu Creative Commons License 2003.02.15 0 0 6
Igy van, a fo nehezseg a forras nyelv elemzese, ugymond megertese. (Ez nem csak az en velemnyem, hanem azt hiszem ebben teljes az egyetertes.)
A generalasi resz nem olyan nehez, de azert ahhoz is le kell fektetni a celnyelv nyelvtanat, es mivel a magyar piac kicsi, lehet, hogy meg nem erte meg megtenni.
A magyar morfologia ugyan egzaktul megoldhato (pl. a Morphologic helyesirasellenorzoje mar nagyon regen megoldotta), de azert nem teljesen trivialis, tehat azok a cegek akik angol-nemet nyelvvel foglalkoznak lehet, hogy nem vettek a faradsagot a Magyar morfologia implementalasara.

Amit a letezo legjobb algoritmusrol irtal: en nem ugy vettem eszre, hogy ezeknek az algoritmusoknak a reszletei teljesen publikusak lennenek. Es ha meg az algoritmusok sejthetoek is, maguk a szabalybazisok vegkepp nem publikusak. Pl. az en angol parserem most kb. 2000 sor szabalyt tartalmaz, es gondolom ez sehol nincs pl. a SYSTRAN-hoz kepest.
Abban sincs egyetertes, hogy milyen egy jo parser; a legkulonfelebb otletekkel lehet talakozni, ez egy kurrens kutatasi tema.

Az sem egyertelmu, hogy mi legyen egy parser kimenete. En egy olyan reprezentacioval dolgozok, ahol ugyanazon allitas formaja teljesen ugyanaz igeidotol igemodtol, tagadastol es attol fuggetlenul, hogy aktiv vagy passziv modban hangzott el a mondat, az igeidot, igemodot, tagadast es a passzivitast mar csak egy-egy flag jellemzi.
Az igek es a melleknevek relaciokka alakulnak, a fonevek pedig entitasokka. A parser kimenete gyakorlatilag entitasok relaciokkal osszekotve.

Előzmény: Silan (2)
Biga Cubensis Creative Commons License 2003.02.15 0 0 5
Gratulálok, hogy már idáig eljutottál. Szerintem tök jó, hogy ilyen szinten foglalkozol vele. Egyébként csak hobbiból írod vagy kereskedelmi termékként (írod, hogy csak úgy felraktad) ? Szerintem azért lenne rá igény, legalábbis én biztos vennék egyet. De elgondolkodtató ugyanakkor, hogy egy profi program jópár fordítónak elvenné a kenyerét. (Persze tudom, hogy ez még utópia)
Előzmény: nadamhu (1)
Anti Nomy Creative Commons License 2003.02.15 0 0 4
Létezik egy olyan tudomány, hogy általános nyelvészet. Ez pontosan ugyanazt csinálja, mint a fizika, vagyis matematikai modelleket készít a vizsgálata tátgyáról, ez esetben a beszélt nyelvről. Sejnos, ez még nem egy olyan kiforrott tudomány, mint pl. a mechanika, vagy a kvantummechanika. Ma is dolgoznalk rajta, többek között magyarok is. Tehát sajnos nem csak a "fiókból kell elővenni" a legjobb elméletet, hanem először létre kell hozni. És a magyar nyelv kükönlegességei igenis sokat tehetnek hozzá ehhez az általános modellezési munkához.
Előzmény: Silan (2)
JFEry Creative Commons License 2003.02.15 0 0 3
Szia!
kérdezed:
A kérdésem: ha az angol-német-spanyol, stb. nyelvek közötti gépi fordítás már aránylag jól megy, vajon mi a fő akadálya annak, hogy angolról magyarra is hasonló színvonalon lehessen fordítani gépileg?

Válaszolod: :-)
Tükörfordítást készít, még a szórenden sem változtat, csak egymás mellé rakja a szótárban található fordításait a szavaknak.

Igen!

Aztán, csak kérdezel valamit, pedig erre is tudod a választ, mert ismered a nyelvet, és a gazdaságot:
A német-angol fordításban szinte kielégítő a tükörfordítás, hiszen a germanizmusok, és anglicizmusok meglenetősen hasonlóak és a szórendjük is eléggé egybevág. Nem is beszélve a fogalomrendszerükről. A Spanyolról ezt nem tudom elmondani, mert nem ismerem. Viszont azt biztosan tudom, hogy mekkora lehet az angol-német piac és igényesség, mekkora lehet a spanyol-angol(ami) piac és igényesség, és hogy mekkorka a magyar piac. (és igényesség? Nem lekezelés képpen!)

Előzmény: Silan (-)
Silan Creative Commons License 2003.02.14 0 0 2
Tehát akkor a fő nehézséget az angol mondat nyelvtani elemzése jelenti? Ez viszont független a magyar nyelv specifikumaitól, és feltehetően már sokan, sokat foglalkoztak vele, úgyhogy ezt nem nekünk magyaroknak kell újra feltalálni. Meg kell keresni a létező legjobb algoritmust, és azt használni.
Előzmény: nadamhu (1)
nadamhu Creative Commons License 2003.02.14 0 0 1
Azert, mert a vilagon keves jo fordito szoftver van, azoknak az elkeszitese is rengeteg energiat igenyelt, es hat a mi kis piacunk eddig meg egyik 'nagy'-nak sem ert annyit, hogy hozzank fejlesszen.
En evek ota foglalkozom ezzel, tavaly mar egy kesz programot is felrekta ma netre, de a minosege miatt meg blamazsnak ereztem a dolgot, es ujra csak akkor rakok fel valamit, ha eleg jo lesz.

IGazabol mas rendszerekrol nem tudok nyilatkozni, izelitonek leirhatom a sajat moduljaimat, es azok megirasanak nehezseget:

Angol morfologiai elemzes : 100%-os pontossaggal megvalositott.
Angol fa eloallitasa: ez nem valosithato meg tokeletesen, tehat tobb lehetseges esetet produkal.
''Szo' jelentes egyertelmusites': (itt dol el, hogy a file allomany-e, vagy reszelo): nem tokeletesen megvalosithato, de kezleheto a mondat'relevanicajanak' a tippelesevel.
Az igevonzat konverzio az elozo reszhez kapcsolodik, itt most nem reszleteznem.
Magyar morfema generalas: nagyon nagy pontossaggal kezelheto
Magyar mofologia: szinten 100%-os pontossaggal megvalositott.

Lenyeg az, hogy sok bonyolult algoritmus mellett, nagyon nagy szabalyadatbazis felepiteset iganyli egy komoly forditoprogram.

Előzmény: Silan (-)
Törölt nick Creative Commons License 2003.02.14 0 0 0
0 mértékben értek a fordítóprogamokhoz.

Úgy gondolom, azért van ez így, mert egyszerűen a program nem tud annyira intelligens lenni, mint az emberi agy, és nem tudja egészében értelmezni a mondatot. Pl. a második mondat végén ahhoz, hogy normálisan le tudja fordítani, elemeznie kellene az angol mondatot, és felismernie benne, hogy az "elv" az ott tárgy, és magyarba átültetve hozzátenni a tárgyragot.
Na most kérdés, hogy hogyan mondod meg a programnak, hogy ismerje fel egy angol mondatban, hogy melyik mondatrész micsoda. Egyszerűen nem tudja mi alapján megkülönböztetni.
A többinek is hasonló oka lehet, legalábbis szerintem.

Előzmény: Silan (-)
Silan Creative Commons License 2003.02.14 0 0 topiknyitó
Észrevettem, hogy jónéhány gépi fordító szolgáltatás létezik az interneten. Pl. a google is aránylag elfogadhatóan fordít angol, francia, olasz, spanyol, német nyelvek között, majdnem bármiről bármire ezek közül. De a magyar nyelv nem szerepel benne. Keresgéltem olyan gépi fordítókat, amelyek ismerik a magyar nyelvet is. Találtam is egyet, de az legfeljebb nevetséges karikatúrája egy fordítóprogramnak. Tükörfordítást készít, még a szórenden sem változtat, csak egymás mellé rakja a szótárban található fordításait a szavaknak. Pl. ezt a mondatot:

"Dolly, the world's first cloned sheep, has been euthanized after being diagnosed with progressive lung disease."

így fordítja le:

"Baba , a világ első klón juh , van euthanized után lét megállapít -val haladó tüdő betegség."

Aztán vásárolható jó pénzért egy NeuroTran nevű szoftver, amely már valamivel fejlettebb (lásd http://www3.tranexp.com/hun/), de azért ez is tud bénázni, pl. ezt a mondatot:

"Bohr invariably demolished Einstein by using Werner Heisenberg's uncertainty principle."

így fordítja:

"Bohr változatlanul lerombolt Einsteint által használó Werner Heisenberg's bizonytalanság elv."

Ez is gyakorlatilag tükörfordítás, és ebből sajnos nem igazán lehet megérteni, mit akart jelenteni az eredeti mondat. Pedig ezt a programot reklámozzák úgy, mint a ma létező legfejlettebb fordítóprogramot.

A kérdésem: ha az angol-német-spanyol, stb. nyelvek közötti gépi fordítás már aránylag jól megy, vajon mi a fő akadálya annak, hogy angolról magyarra is hasonló színvonalon lehessen fordítani gépileg? Valami alapvető elvi problémáról van szó, vagy egyszerűen csak még senki nem vette a fáradságot, hogy egy kicsit intelligensebb programot írjon?

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!