Keresés

Részletes keresés

A hozzászólás:
Kvász Ivor Creative Commons License 2009-07-17 08:34:37 1164
Azért általában a nyelvtan is különös súllyal esik latba a nyelvek genetikus besorolásánál. Azzal a megszorítással, hogy ahol az alapszókincs és a nyelvtan eltérő eredetűek - kreol nyelvek, AngloRomani, franciával lecserélt szókincsű wolof diáknyelv -, ott a nyelvészek már simán nemgenetikus eredetű nyelvekről beszélnek. Továbbá nyilván nehezebb összevetni nagyon régen szétvált nyelvek nyelvtanát, amelyek esetleg már tipológiailag is megváltoztak. De nem hiszem, hogy ahol két nyelv toldalékmorfémái (stb.) strukturális egyezést mutatnak, ott ezt a genetikai rokonságról nyilatkozó nyelvész ne említené meg.
Előzmény:
rumci Creative Commons License 2009-07-17 00:30:57 1161
A történeti-összehasonlító nyelvtudomány foglalkozik a nyelvek rokonításával, de – miként a bölcsészettudományok általában – az objektivitás itt semmiképp sem jelent számszerűséget.
A TESz.-ben való számolgatás módszertanilag teljesen hibás, ráadásul az illetőnek láthatólag fogalma sem volt az alapvető etimológiai kategóriákról. (Arról nem beszélve, hogy negyvenéves etimológiai szótárat egy ilyen vizsgálat alapjává tenni is elég furcsa.)
Az alapvető módszertani hiba, hogy a szótári szógyakoriság egyszerűen semmit nem mond el semmiről, és ezt statisztikázni ugyan lehet, de az se fog semmiről semmit elmondani. A nyelvtípusok idekavarása (pl. agglutináció) szintén ide nem való dolog, hiszen közeli rokon nyelvek tartozhatnak különböző típusba (német: flektáló, angol: izoláló), és olyan nyelvek, amelyeknek semmi közük egymáshoz, tartozhatnak ugyanabba a típusba (6-7 ezer nyelvről szokás beszélni, és 3-4 alapvető nyelvtípusról, ebből logikusan következik, hogy teljesen más ügy).
Nyelvek rokonságában nem a nyelvtan, hanem mindig a lexikai állomány a perdöntő. De nem a lexikai állomány egésze, hanem az ún. alapszókészlet, valamint a grammatikai morfémák teste. Ha ezekről ki lehet mutatni, hogy közös ős leszármazottai, akkor ezek a nyelvek rokonok. Márpedig a magyar nyelv ezen az alapon tisztán, egyértelműen és bombabiztosan a finnugor nyelvcsaládba tartozik.
Ha már mindenáron statisztikázni akarunk, akkor viszont csináljunk értelmes statisztikát. Én ezt egyszer meg is tettem. A Magyar értelmező kéziszótár 2003-ban megjelent, 2. kiadása ugyanis tartalmaz egyrészt gyakorisági adatokat (a megjelent változat csak 5 osztályba sorolja a Magyar nemzeti szövegtár-beli gyakoriságokat, de nekem a vizsgálathoz rendelkezésemre álltak a pontos értékek), másrészt a szócikkek végén közül nagyon korszerű, igaz tökéletesen zanzás etimológiai információt is (a transzparens felépítésű belső keletkezésű szavak esetében ez elmarad, de ezek is könnyen besorolhatók a belső keletkezésűek felvázolt etimológiái közé.
No hát egyebek mellett egy kutatásban feldolgoztam ezeket az adatsorokat. Alább látható lesz tehát az etimológiai kategóriák type-gyakorisága (tehát hány szótári tétel tartozik az egyes kategóriákhoz), valamint a tokengyakoriságuk (ez tehát azt emulálja, hogy egy átlagos szövegben milyen gyakoriak az egyes etimológiai kategóriákba tartozó szóelőfordulások). Az előbbi nem sokat mond a nyelvről, hiszen ha egy szótárat sok ritka, de új jövevényszóval dúsítunk fel, akkor a szókészlet masszív törzsállománya szinte elvész ezek között. Sokat mond viszont a szöveggyakoriság (amit igen jól közelít a gyakorisági értékekkel való számolás). És ott már azt láthatjuk, hogy a belső keletkezésű szavak után már az fgr-rel jelölt ősi szavak vannak legtöbben. Ha az egyes belső keletkezésű szavak szóelemeit (összetételi tagjait, töveit, képzőit) a maguk etimológiai kategóriájával helyettesítettem volna, akkor még nagyon lenne a kontraszt, ugyanis közhely, hogy az ősi, tehát az ugor, finnugor, uráli korból hozott magyar szavak a legproduktívabbak a szóképzés, összetétel-alkotás bemeneteként.
Természetesen aránylag sok, még a szöveggyakoriságot tekintve is, az ismeretlen eredetű szó a magyarban, de ha arra gondolunk, hogy milyen rég szakadt ki a magyar az ugor egységből, ráadásul azt is hozzávesszük, hogy mennyire későiek a finnugor nyelvek írásos emlékei, törvényszerű, hogy egy csomó ősi szó csak a magyarban élt tovább mindmáig, tehát a rokon szavak kihalván, nincs mivel összevetni őket.

(Az összekötő vonal természetesen csalás, hiszen nincsenek köztes értékek, pusztán a látást segítik.)

A különféle etimológiájú szavak szótári gyakorisága (logaritmikus skálán)
1. A különféle etimológiájú szavak szótári gyakorisága (logaritmikus skálán)

A különféle etimológiájú szavak szöveggyakorisága (logaritmikus skálán)
2. A különféle etimológiájú szavak szöveggyakorisága (logaritmikus skálán)

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!