|
|
 |
rhaurin
2003-09-07 23:30:54
|
15
|
Ha jól értem, akkor ketten dolgoztok rajta 5 éve, lényegileg a szbadidötökben. Ebböl igy nem lesz soha semmi. Értem, hogy arról álmodoztok, hogy ez valamikor kitünö üzlet lesz és visszajön a pénz kamatostul, de ez valószinütlen. Egy igazán használható rendszerhez rengeteg pénz kell, rengeteg munka, mindenesetre sokkal több, mint pár emberév. Nem hiszem, hogy ezt meg tudjátok finanszirozni.
Ugyanakkor - különösen most, az EU csatlakozás után - biztos, hogy hatalmas kereslet lesz gyors, szük szakterületekre koncentráló gépi forditás-segitö (nyersforditó) rendszerekre. Nincs kizárva, hogy erre egy-két nagy cég ráugrik és kivásárolnak titeket, meg még azt a pár csapatot, aki ilyesmivel foglalkozik a konyhaasztal sarkán. Ez talán hozhat nektek valami zsozsót, de a témáról akkor le kell mondanotok, hacsak el nem adjátok magatokat is a progival együtt.
Ezt én nem tartom jó végkifejletnek. Egy normális világban inkább az történne, hogy az állam, az adófizetök pénzéböl kivásárolná az ilyen forráskódokat és GNU GPL alatt publikálná. Aztán mögé tenne egy közpézekböl finanszirozott csapatot, amelyiknek a kódbázis karbantartása, az interfészek szabványositása lenne a feladata valamint a dokumentációk publikálása és a kapcsolódó szakirodalom hozzáférhetövé tétele, röviden: a munka összefogása.
A tényleges munkába szerintem nagyon sokan beszállnának. Egy részük egyszerüen kedvtelésböl, de nyilván vannak olyan egyetemi kutatóhelyek is, amelyek bekapcsolódnának, söt, jó esélyjel lehetne szponzorokat is szerezni olyan cégek köréböl, akik érdekeltek abban, hogy egy müködöképes és lehetöleg teljes magyar nyelvi környezet összeálljon. Azt talán már észrevettétek, hogy a természetes nyelv-feldolgozás jól modularizálható feladat, ugyanaz a modul egészen eltérö alkalmazásokban is használható. Ha a fejlesztés publikusan folyna, ki lehetne dolgozni a szabványos interfészeket és mindegyik modul többé-kevésbé függetlenül fejleszthetövé és tesztelhetövé válna.
Mivel a magyar piac nem olyan nagy, szerintem ezzel a módszerrel sokkal hamarabb (és sokkal olcsóbban) jutnánk magas szinvonalú megoldásokhoz, mintha arra várunk, hogy majd valamelyik nagy nemzetközi cég elöbb-utóbb beleteszi azt a rengeteg pénzt, amire itt szükség lenne. Egy ilyen közös alapon sokkal nagyobb esélyjel lehetne aztán valódi kereskedelmi termékeket is épiteni.
Persze nehéz megitélni, hogy milyen minöségü az eddig elvégzett munkátok: talán érdemes lenne addig is felhúzni egy szervert és csinálni vmi kis cgi interfészt, amin keresztül bárki tesztelhetné (kisebb szövegekkel) a progitokat. Ez szerintem nektek is tanulságos lenne.
Ha érdekel, elmondhatom azt is, hogy nagy vonalakban milyen nyelvi modul-rendszert képzelek és milyen potenciális alkalmazási területeket látok. |
|
A hozzászólás:
 |
nadamhu
2003-09-07 21:48:30
|
14
|
Hu, mar nagyon regen nyitottam ezt a topicot, de a program fejlesztese (egy feleves szunet kivetelevel) azota is folyik. Szinte a teljes rendszer at lett irva. Jovo tavasszal ismet kiadom a programot, de most mar erezhetoen jobb minosegu lesz, mint az elozo verzio.
Egy keveset lehet olvasni a technikarol, legalabbis az angol elemzes reszrol az oldalamon.
http://www.cybertron.hu
A gepi forditasrol altalaban annyit tudni kell, hogy a kozelebe nincs annak, hogy olyan eredmenyt produkaljon, mint az emberi forditas, es a kozeljovoben szvsz nem is fog, hacsak nem az emberi gondolkodast is modellezni tudjuk.
Ezzel szemben technikai szovegek gyors megertesere mar hasznalhato, mar vannak cegek, akik boven megelnek belole: Pl. Systran.
>Még csak nem is az a baj, hogy egy szónak több >jelentése van; a problémát az a teljes mértékben >téves feltételezés, hogy a nyelv alapegysége a >szó.
Valoban melyebb szinten nem a szo az alapegyseg, (en pl. entitas-relaciokkal valositom meg a belso nyelvet) Mar egy egyszeru angol-magyar zsebszotar sem szavak, hanem kifejezesek forditasat irja le, - persze sajnos nem formalis modon -.
|
|
Előzmény:
 |
Újlaki
2003-09-07 20:32:10
|
13
|
Még csak nem is az a baj, hogy egy szónak több jelentése van; a problémát az a teljes mértékben téves feltételezés, hogy a nyelv alapegysége a szó. Nem igaz, a nyelv alapegysége a kifejezés, esetleg a teljes mondat.
Ha el is fogadnánk, hogy a szó az alapegység, és a nyelvet le lehet írni egy szótárral és egy véges szabályhalmazzal, akkor is az a probléma, hogy ahány beszélő és ahány hallgató, annyi különböző nyelv van, azaz annyi különböző szótár és nyelvtan. A fordítás mindig attól függ, hogy ki mondta kinek, és hogy ezt a fordító mennyire képes megérteni és valakinek elmondani.
Ráadásul még akkor is baj van, ha megtaláljuk a végtelen sok közül az adott esetre jól-rosszul alkalmazható szótárt és nyelvtant, ugyanis mind a kettő akár egyetlen közlés során, menet közben is változik. Gondoljunk egy nyelvtanulásra, vagy tárgyalásra, udvarlásra, ahol folyamatosan változik a résztvevők tudása, stratégiája és taktikája, és menet közben dinamikusan ehhez igazítják az éppen használt nyelvet. |
|
|
Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!
|