Keresés

Részletes keresés

buta Elizabeth Creative Commons License 1999-11-14 12:35:30 186
Kedves Tova Szilárd !
Jaj,de sajnálom, hogy csak most tévedtem ebbe a topicba !
A programod feltétlenül érdekel, kérlek, küldj róla valami bővebbet,
üdv,
Elizabeth czopyk@hotmail.com
A hozzászólás:
Tova Szilárd Creative Commons License 1999-07-31 13:46:56 11
Végre valaki fölvetette...
Mivel buta programozó vagyok, aki csak hobbiból foglalkozik nyelvészettel, általában csak "kukkolok" ebben a rovatban, de ez a téma igen közel áll a szivemhez.
Tizenéve levelezek egy kínai kollégával (eszperantóul), aki szintén amatőr nyelvimádó; kedvenc témája a mesterséges nyelv. Ehhez magyarul jelent meg Dr. Szerdahelyi Istvánnak egy kiváló könyve, "Bábeltől a világnyelvig".
Nos, jó Hai Tao barátom fejébe vette, hogy ő pedig ezt a könyvet végigolvassa. Hát így indult az én fordítástámogató programom...
Több fokozaton keresztül kívánok eljutni odáig, hogy valódi segítséget tudjon adni a magyar nyelvet nem ismerőknek.
Eddig a toldalékolt szavak előállításával foglalkoztam, nemrég kezdtem el az ellenirányt: az analizálást, felismerést.
Először egy 24.000 szavas szótárat készítettem, a szavakat elláttam a képzők/jelek/ragok helyes használatához szükséges attribútumokkal, majd - hogy némi játék is legyen a dologban - írtam egy anagrammakészítő programot, ami a szavak összes (szintaktikusan helyes) toldalékolt alakját előállítva működik. [Az érdeklődőknek szívesen elküldöm tesztelésre (Win'32)]
Az éjszaka írtam mag az első szóelemzőt. Ráeresztettem egy hatvanezer szavas állományra, és csak négyezret dobott ki nem értelmezhetőként.
Kezdetnek nem rossz...
Persze, nem kívánok konkurrálni Prószékyékkal :), de néhány "morfologikátlan" op.rendszerhez még el lehetne sütni egy helyesírás-ellenőrzőt. De az még messze van...

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!