Keresés

Részletes keresés

A hozzászólás:
rumci Creative Commons License 2006-05-21 11:36:32 4
http://mokk.bme.hu/projektek/szoszablya/
Előzmény:
moonshadow Creative Commons License 2002-10-26 15:18:03 -
Sziasztok :)

Érdekelne, hogy a magyar nyelvben használható szókincsről valakik valamikor gyűjtöttek-e adatokat. Összesen a használt szavak mennyisége, az arányok, hogy pl. mennyi 2-3-4-5... betűs szavak vannak. Most dolgozom egy programon, ami először is a számítógépen található szöveges és html dokumentumokból gyüjti ki az értelmes magyar szavakat, de képes lesz felmenni a netre is és végigbogarászni pl a fórum lapjait onnan is kigyűjteni az értelmes szavakat. A szavakat azután abc sorrendben és a betűszámuk alapján különböző fájlokba gyűjti. Egyenlőre a nehézséget főleg az okozza, hogy a program nem tud különbséget tenni a magyar és az angol szavak között. Arra is kíváncsi vagyok, hogy érdekel-e valakit még ez a téma?

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!