rumci Creative Commons License 2009.07.21 0 0 1169
Úgy látom, túlzottan bele vagy ragadva a kvantitatív szemléletbe. Tőlem (mint valaha matematikusnak készülő embertől) nem idegen ez, de nincs mit tenni, a nyelvészet legtöbb részterülete nem ilyen. Magyarán a kérdésfelvetéseiddel nem nagyon lehet mit kezdeni. Ilyenkor szokás azt mondani, hogy érdemes beiratkozni valamilyen nyelvészeti kurzusra, illetve elolvasni mértékadó bevezetőket, és utána visszatérni a konkrétumokra.
A dolog pikantériája, hogy a témában egyetlen szigorúan kvantitatív módszertannal próbálkoztak, az ún. glottokronológiával, az viszont csúfosan megbukott – akármilyen szép elméletnek is látszott.

„Mekkora a magyarban az alapszókészlet? (számszerűen)”
Az alapszókészlet nem egy szigorúan, éles vonallal elhatárolt része a szókészletnek.

„Milyen tudományos elvek alapján lettek pont ezek a szavak kiválasztva?”
Természetesen konkrét vizsgálatokra lehet gyártani százas, kétszázas, akármekkora listákat (akár gyakorisági, akár fogalomköri alapon), számos ilyen lista van forgalomban, de épp a fentiek miatt nincs nagy jelentőségük.

„A »bombabiztos« helyett kérhetnék egy számszerű adatot? Mármint az x számú kiválasztott magyar alapszóból mennyi a finnugor?”
A fentiek alapján most már számodra is biztos világos, hogy maga a kérdésfelvetés is teljességgel idegen a történeti-összehasonlító nyelvtudomány módszertanától.

„A TESZ (nem ismerem behatóan még) sok ritka, de új jövevényszót tartalmaz?”
11-12 ezer címszó van a TESz.-ben, összetételek alig lettek címszóvá, képzett szavak inkább. De 11-12 ezer gyakori szó nincs egyetlen nyelvben sem.

„A Zaicz Gábor féle (ha jól tudom frissen kiadott) etim. szótár sok ilyet tartalmaz?”
A Zaich Gábor nevén megjelent munka nem tudományos szótár, hanem népszerűsítő kompilátum, elsősorban a TESz., másodsorban az EWUng. alapján. Annak a végén vannak mindenféle statisztikák. Nekem ez a szótár nincs birtokomban, a fentiek okán.

„Milyen az az átlagos szöveg? Ezt hogyan állapítják meg róla?”
A statisztika alapjául a Magyar nemzeti szövegtár szolgált, ez (akkori állapotában) 150 millió szövegszavas reprezentatív korpusz. Ilyen méreteknél bőven elég, ha aránylag vegyes a szöveg, az értékek kiátlagolódnak.

A kérdezted adatok:

Szótári értékek:
belső keletkezésű szavak: 61 057
ősi (uráli+finnugor+ugor) örökség: 582
ismeretlen eredetű szavak: 594

Szövegbeli értékek:
belső keletkezésű szavak: 76 985 401
ősi (uráli+finnugor+ugor) örökség: 36 507 542
ismeretlen eredetű szavak: 2 665 317

Vogul és osztják, vagy ha jobban tetszik, manysi és hanti szójegyzékről nem tudok a neten, de hát ne feledjük, hogy ezeknek a nyelveknek nincs sztenderdizált változatuk sem, csak nyelvjárásokban léteznek, tehát nehéz is lenne efféle szójegyzékeket összeállítani (természetesen papírszótárak vannak a különféle nyelvjárásokról). A legjobban tán az UEW.-vel (Uralisches etymologisches Wörterbuch) járnál, igaz, az alapnyelvi alakok szerint van betűrendbe sorolva, viszont vannak hozzá mutatók.

Amíg nem tudsz hozzájutni ilyen forrásokhoz, nagyon javaslom ezt a szórakoztató, mégis abszolút komoly tudományos háttérrel megalapozott ismeretterjesztő blogot:
http://renhirek.blogspot.com/
Előzmény: hopplaho (1162)