Keresés

Részletes keresés

nadamhu Creative Commons License 2003-09-08 11:09:31 16
Eleg jol latod a dolgokat. Csak nem foglalkoztal ilyesmivel?
>Ha jól értem, akkor ketten dolgoztok rajta 5 >éve, lényegileg a szbadidötökben
Ennyire sok munka nincs azert benne. Vegul is egyedul csinalom, es igazan aktivan "csak" 2001 oktobere ota. De tenyleg csak szabadidomben. (Amit viszont jo sokat kell ra aldozni:))

Abban igazad van, hogy igazan jo eredmenyt igy nem fogok elerni, mert itt tenyleg nem eleg nehany jo otlet, rendgeteg 'verejtekes munka' is kell a rendszer elkeszultehez.

Ugyhogy a celom az, hogy amikor mar eleg komoly eredmenyt tudok felmutatni, valahogyan be akarok vonni masokat. Eddig nem igazan neztem befekteto utan sem, ha ugy erzem eleg jo demot tudok prezentalni, akkor ezt a tevekenyseget is elkezdem.

A rendszer termeszetesen modularis, a modulok:

- angol morfologiai elemo
- angol nyelvtani elemzo (nem a hagyomanyos nyelvtanrol van szo,annal magasabb szintu, pl. az aktiv es passziv igeidoben mondott mondatot ugyanabba a strukturaba elemzi.)
- 'jelentes finomitas' (gyakorlatilag egyes szavak jelenteset valasztja ki a tobbi fuggvenyeben.)
- magyar nyelvtani generalas
- magyar morfologiai generalas.

Ha van kedved szivesen bemutatom a rendszert szemelyesen is, (a forrasat is) es esetleg megbeszelhetjuk, hogy te milyen modulokat kepzelsz el.

A hozzászólás:
rhaurin Creative Commons License 2003-09-07 23:30:54 15
Ha jól értem, akkor ketten dolgoztok rajta 5 éve, lényegileg a szbadidötökben. Ebböl igy nem lesz soha semmi. Értem, hogy arról álmodoztok, hogy ez valamikor kitünö üzlet lesz és visszajön a pénz kamatostul, de ez valószinütlen. Egy igazán használható rendszerhez rengeteg pénz kell, rengeteg munka, mindenesetre sokkal több, mint pár emberév. Nem hiszem, hogy ezt meg tudjátok finanszirozni.

Ugyanakkor - különösen most, az EU csatlakozás után - biztos, hogy hatalmas kereslet lesz gyors, szük szakterületekre koncentráló gépi forditás-segitö (nyersforditó) rendszerekre. Nincs kizárva, hogy erre egy-két nagy cég ráugrik és kivásárolnak titeket, meg még azt a pár csapatot, aki ilyesmivel foglalkozik a konyhaasztal sarkán. Ez talán hozhat nektek valami zsozsót, de a témáról akkor le kell mondanotok, hacsak el nem adjátok magatokat is a progival együtt.

Ezt én nem tartom jó végkifejletnek. Egy normális világban inkább az történne, hogy az állam, az adófizetök pénzéböl kivásárolná az ilyen forráskódokat és GNU GPL alatt publikálná. Aztán mögé tenne egy közpézekböl finanszirozott csapatot, amelyiknek a kódbázis karbantartása, az interfészek szabványositása lenne a feladata valamint a dokumentációk publikálása és a kapcsolódó szakirodalom hozzáférhetövé tétele, röviden: a munka összefogása.

A tényleges munkába szerintem nagyon sokan beszállnának. Egy részük egyszerüen kedvtelésböl, de nyilván vannak olyan egyetemi kutatóhelyek is, amelyek bekapcsolódnának, söt, jó esélyjel lehetne szponzorokat is szerezni olyan cégek köréböl, akik érdekeltek abban, hogy egy müködöképes és lehetöleg teljes magyar nyelvi környezet összeálljon. Azt talán már észrevettétek, hogy a természetes nyelv-feldolgozás jól modularizálható feladat, ugyanaz a modul egészen eltérö alkalmazásokban is használható. Ha a fejlesztés publikusan folyna, ki lehetne dolgozni a szabványos interfészeket és mindegyik modul többé-kevésbé függetlenül fejleszthetövé és tesztelhetövé válna.

Mivel a magyar piac nem olyan nagy, szerintem ezzel a módszerrel sokkal hamarabb (és sokkal olcsóbban) jutnánk magas szinvonalú megoldásokhoz, mintha arra várunk, hogy majd valamelyik nagy nemzetközi cég elöbb-utóbb beleteszi azt a rengeteg pénzt, amire itt szükség lenne. Egy ilyen közös alapon sokkal nagyobb esélyjel lehetne aztán valódi kereskedelmi termékeket is épiteni.

Persze nehéz megitélni, hogy milyen minöségü az eddig elvégzett munkátok: talán érdemes lenne addig is felhúzni egy szervert és csinálni vmi kis cgi interfészt, amin keresztül bárki tesztelhetné (kisebb szövegekkel) a progitokat. Ez szerintem nektek is tanulságos lenne.

Ha érdekel, elmondhatom azt is, hogy nagy vonalakban milyen nyelvi modul-rendszert képzelek és milyen potenciális alkalmazási területeket látok.

Előzmény:
nadamhu Creative Commons License 2003-09-07 21:48:30 14
Hu, mar nagyon regen nyitottam ezt a topicot, de a program fejlesztese (egy feleves szunet kivetelevel) azota is folyik. Szinte a teljes rendszer at lett irva. Jovo tavasszal ismet kiadom a programot, de most mar erezhetoen jobb minosegu lesz, mint az elozo verzio.

Egy keveset lehet olvasni a technikarol, legalabbis az angol elemzes reszrol az oldalamon.
http://www.cybertron.hu

A gepi forditasrol altalaban annyit tudni kell, hogy a kozelebe nincs annak, hogy olyan eredmenyt produkaljon, mint az emberi forditas, es a kozeljovoben szvsz nem is fog, hacsak nem az emberi gondolkodast is modellezni tudjuk.

Ezzel szemben technikai szovegek gyors megertesere mar hasznalhato, mar vannak cegek, akik boven megelnek belole: Pl. Systran.

>Még csak nem is az a baj, hogy egy szónak több >jelentése van; a problémát az a teljes mértékben >téves feltételezés, hogy a nyelv alapegysége a >szó.
Valoban melyebb szinten nem a szo az alapegyseg, (en pl. entitas-relaciokkal valositom meg a belso nyelvet) Mar egy egyszeru angol-magyar zsebszotar sem szavak, hanem kifejezesek forditasat irja le, - persze sajnos nem formalis modon -.

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!