Megoldható lenne az hogy a csomagra 50$ alatti értéket irj,+ ajándékként add fel? Erről állits ki számlát, és ne tüntesd fel a csomagon h mi van benne!?
Azt írtad: "én úgytudom a magyar ragasztó+tapasztó nyelvtan miatt nem lehet / nagyon nehezen tökéletes forditóprogramot irni"... Többek közt ez teszi olyan egyedülállóan tömörré csodálatosan szép nyelvünket. Vagy Neked a géppuska-szerűen kerepelő, kattogó, mindent precízen helyretevő és besoroló német nyelv jobban tetszik? Mindjárt gondoltam...
Áh, ha megvan írva normálisan az esperando fa-generátor, simán szétcsócsálja a szót és átfordítja másik nyelvre.
Ez a köztes, univerzális digi-nyelv, ez jó. Ez lehet a jövő, mármint a nyelvfordító programok tekintetében. Meg szerintem ezt külön érdemes lenne kidolgozni, nagyon-nagyon, pl. azt is letárolni, hogy az adott mondatban hol lehet a hangsúly. Na, ezt megállapítani a legnagyobb gond, mert pl. magyarra fordításnál a szórend is nagyban függ ettől. De megállapítani a hangsúlyt bizonyos esetekben teljességgel lehetetlen...
És ott van még az egyedi szólás-mondások témaköre, amelyeket szintén nem lehet sehogysem más, eltérő struktúrájú nyelvekre fordítani. A franciában, magyarban, de egyébként minden nyelvben van egy rakás ilyen.
Továbbmegyek: a szóviccek fordításának nehézsége. :-)))))
Részmegoldást jelenthetne ezeknél az eldönthetetlen eseteknél, hogy a kivételekből egy jó nagy listát kéne összeállítani. Ha jól meg van írva az univerzális köztes faszerkezet, akkor a bármely nyelvből bármely nyelvbe történő fordítás nem nagy kunszt. (Khm...) A nagy munkát a kivételek feljegyzése, azok frissítése jelenti, ahogy a nyelvek fejlődnek.
én úgytudom a magyar ragasztó+tapasztó nyelvtan miatt nem lehet / nagyon nehezen tökéletes forditóprogramot irni...
pld ezt: irattathattatok kiváncsi leszek mikor fogja egy program jól szétszedni és forditani... más europai nyelvekben tudomásom szerint ennyi infót nem barkálcsolnak bele egy szóba...
A múltkor találtam egy érdekes linket, talán mond valamit.. algoritmus nincs benne, de elég jól összefogja a témát (többek között a nyelvi "értelmezést"..)
Elnezest a kesoi valaszert, az utobbi hetekben nem igazan volt idom a programmal foglalkozni.
Egyelore nem kerulnek at az elozo mondat fogalmai a kovetkezobe.
Vannak olyan iranyu terveim, hogy az aktualis mondat forditasa soran egy 'context' folyamatosan valtozik, aminek az allapotatol teszek fuggove bizonyos dolgokat a forditas soran. Ez azonban meg nincs kidolgozva. Olyan otleteim vannak pl., hogy olyan dolgokat tarol a context, hogy ha 'this,that' jellegu entitas van, akkor az vajon mire vonatkozhat, stb...
Kerdezed, hogy hogyan erzekelem, hogy fonev vagy ige egy szo. Nos a nyelvtani elemzes soran eleinte veszem az osszes lehetoseget, es belerakom egy nagy kupacba. Azutan amikor felismerem, hogy nehany elem egymas mellett alkothat egy ujabb elemet, akkor azt letrehozom, es azt is belerakom a kupacba. A vegen letrejon akar tobb olyan elem is, amely az egesz mondatot lefedi. Magyarul, hogy vegul a szo mint fonev, vagy mint ige kerult be az elemzesi faba, a kornyezetetol fugg.
A prioritas azert kell, mert ha tobb olyan elem is letrejon, ami lefedi az egesz mondatot, muszaly kozuluk dontenem.
Nemsoka felrakok egy oldalt, amelyik kifejezetten az angol nyelvtanom egyfajta referenciaja, es tartalmaz nehany pelda elemzest is. Majd beirom ebbe a topicba is a linket.
Kedves nadamhu!
Mesélj még a programodról, a tárolásról.
Mondjuk arról, hogy az előző mondatból hogyan kerülnek át fogalmak (ralációk és entitások) a most értelmezendőbe. Persze csak akkor ha szükség van rá. Ezt hogy veszed észre.
Továbbá arról, hogy hogyan érzékeled (hogyan lehetne érzékelni) azt, mikor főnév és mikor ige egy szó.
A 18. hozzászólásodban prioritásról beszélsz. Nem lehetne ezt megkerülni? És valahogy máshogy dönteni? Hogy is keletkezik az a bizonyos 3 fordítás ami közt választani kell?
Persze, webes interfeszt gyartani a legkevesebb, fuggetlenul attol, hogy milyen nyelven van megirva. C++ programot lehet pl. CGI-kent hivni, vagy egy kozbulso vekony CGI kommunikalhat egy szerverprocesszel, vagy ha hatekonysagra torekszunk, egyszeruen APACHE modulkent is meg lehet oldani. A lehetosegek tarhaza ezen a teren vegtelen.
Igen, C++ - ban idodik a progi. (Eredetileg Java-ban kezdtem, de muszaly volt rajta gyorsitanom.)
Ha mar olyan allapotban lesz, fel fogok rakni valami tesztelnivalot.
Tényleg jó látni, hogy azért haladsz és vannak eredmények. Azt sajnos nem tudom vállalni, hogy aktívan besegítek, de lenne egy ötletem. Gondolom a programod valamilyen objektumorientált nyelvben íródott, esetleg érdemes lenne átteni Java-ra, lefordítani és felrakni a netre egy egyszerű kis html form-al. A topiclakók gondolom szívesen tesztelnék, gyötörnék a rendszeredet, a visszajelzések alapjén talán gyorsabban haladnál és gyorsabban megtalálnád a hibákat. Persze ez csak egy ötlet.
De itt nyelvhasználati szokásokól van szó, kifejezésekről, stb.
Ezeket elég nehéz csavargatni két nyelv között..
Inkább adatbázison, és annak lekezelésén múlik mint túlzott okosságon..
Egyszer kellett egy több ezer bolygós rendszerhez név generátor progit írnom (már 1993-ban is nagyban gondolkodtunk :).
Véletlenszerű volt hogy magánhangzóval kezd-e vagy mássalhangzóval, és ahhoz a karakterhez képest döntött(nagyobb arányban az egyik típus felé hajolva, de még mindig véletlenszerűen), hogy mással- vagy magánhangzóval folytassa-e. A választott csoportból választott ismét egy betűt, és így tovább..
Meg egy erdekes adalek, ami talan betekintest nyujt, hogy meg egy primitiv esetben is milyen nehezsegekkel kell megbirkozni.
Vegyuk a:
'I am running.'
mondatot.
Nem is olyan regen a programom, az en legnagyobb elkeseredesemre, - felszerelkezve mindenfele nyelvtani szaballyal - 3 fele forditast kozul nem tudott valasztani:
Futok.
Futva vagyok.
Futás vagyok.
Ma már az elsôt választja, hála a prioritási rendszernek: A present continous szably alkalmazasakor egy prioritas pontot kap az elso allitas, mig a masik ketto 0 prioritas ponttal rendelkezik, igy az elso nyer.
Szoval egy ilyen szerkezetet generalo nyelvtanom egy bizonyos szinten mar most mukodik, ez a kulcsa mindennek. Egyebkent, ha ezt a fat korrektul sikerul aloallitani, ebbol ertheto magyar szoveget generalni mar nem (annyira) nagy kunszt.
Ugyanis az elemzsenel elojon az a problema, hogy egy nyelvi elem jelenteset a kornyezete hatarozza meg. (Egy csomo szo lehet ige is es fonev is, hogy csak a legegyszerubb esetet emlitsem. A THAt lehet determinans, nevmas, es kotoszo is!!!) Generalasnal ez a problema mar nem jelenik meg.
Ha sikerul megtalalni azt a melyszerkezetet, amelyre mindketto konvertalhato akkor ez nem okozhat gondot.
Hogy ne csak a levegobe beszeljek:
En a szoftveremben a forrasnyelvbol egy 'funkcionalis nyelvtani fa-t' epitek; en ebben a faban erzem azt az altalanossagot, amely minden altalam ismert nyelvben ugyanaz:
A fanak ketfajta alapveto csomoponja van:
- relaciok (igekbol es melleknevekbol alakulnak ki)
- entitasok (fonevek, nevmasok)
minden mas szofaj 'nyelvtani toltelek', a nyelvtani szabalyok szerves resze, de a melyszerkezetben mar nem jelennek meg egyertelmuen.
Erdemes elgondolkodni azon, hogy a melleknevek es az igek melyszerkezetileg egy kategoriaba sorolhatok. Oket hivom relacioknak.
Hogy egy peldat is hozzak:
Egy angol mondat:
I am reading a book in the classroom.
Melyszerkezete:
(RELATION READ TIME:PRESENT_CONTINOUS MOOD:DECLARATIVE
SLOT SUBJECT (ENTITY I DET:NOTHING)
SLOT OBJECT (ENTITY BOOK DET:A)
SLOT IN (ENTITY CLASSROOM DET:THE)
)
Kis kiegesziteskent jegyzem meg, hogy a modellemben a jelezes is (alarendelt) allitas pl.:
the nice book
(ENTITY BOOK DET:THE SUBSTATEMENT(
RELATION NICE SLOT SUBJECT .
))
(a . az adott esetben a BOOK-ra hivatkozik.)
De pl. a birtokos jelzo, a birtokos nevmas, az 'of' szerkezet, es az ''s' - szerkezet is
az
RELATION OWNS
- ra vezetodik vissza...
Az altalam kidolgozott modell ennel osszetettebb es arnyaltabb, de vitainditonak es illusztracionak talan eleg ennyi.
Egyebkent ha valaki szeretne reszt venni az angol-magyar forditom kesziteseben, es ert nyelveszethez VAGY programozashoz, szivesen latom, mivel (foleg a szokincsbovites) babra munka, es a latvanyos eredmenyt egyedul csak rendkivul hosszu ido utan fogom tudni elerni.