Keresés

Részletes keresés

villamosjegy Creative Commons License 2007.06.27 0 0 497
"Najó, persze barátunknak abban igaza van, hogy az, hogy egy adott helyen egy [j] hang ly vagy nem ly, elvileg tényleg 1 bit információkülönbség. Csak azt nem veszi figyelembe, hogy 1 bit információkülönbség még nem információ, azt meg végképp nem, hogy műszakilag 1 bit különbséggel szart se lehet kezdeni. Azt meg, hogy biologice vagy mentálisan mit, még a jóisten se tudja."

De információ, mi a fene lenne. Pontosanm ez az információ. Ha csak egy bitnyi is.
Egyébként "Ödönke mássz fel a karnisra" és "Ödönke ne mássz fel a karnisra" között is csak egy bit a differencia. Ezért nem szabad Ödönkének a második mondtatot mondani - csak akkor ha már ott lóg - , mert egyébként eszébe sem jutna.

Többeknek: egyébként pedig nem vagyok nyelvész, teszek rá mi a nyelvészetileg a "szótő".
Előzmény: ZsB (490)
ZsB Creative Commons License 2007.06.27 0 0 496

Ez kábé triviális (én is utaltam rá korábban). De menjünk vissza a kályhához. villamosjegy azzal az csillogó enthümémával gazdagította a jottista-ipszolista háborúban az ipszilonista oldalt, hogyaszongya: Itt többen mindenféle hülye érveket hoztak elő az ely ellen. Fő érvük az volt, hogy ne bonyolítsuk a gyerekek életét. Mert Ödönke nem képes elraktározni 500 bitnyi (!!!) információt. Nem tudom kiket tanítanak a hozzászólók. ZX-Spectrumokat?

 

Namost a három felkiáltójeles 500 bittel mint érvvel csak az az apró bibi van, hogy senkinek halvány gőze sincs, hogy mi van Ödönke fejében, és mi történik ott, amikor Ödönke beszél, meg amikor - ezzel csak laza összefüggésben - ír, plánedesőt - és méglazább összefüggésben - amikor "helyesen próbál" írni. Természetesen arról sincs fingja senkinek, hogyan tárolja Ödönke feje a mindezen tevékenységekhez szükséges információkat. Egyre azonban mérget vehetsz: nem bitekben.

 

Vagyis az ugyan igaz, hogy egy matematikai modellben a feladatban felbukkanó információkülönbség néhány száz bitre redukálható, kár, hogy ennek a modellnek a valósághoz az égvilágon semmi köze sincs. Mégvagyisabb: villamosjegy ugyan nyegle volt, de érvet, azt nem hozott föl, egy szálat se.

Előzmény: scasc (494)
scasc Creative Commons License 2007.06.27 0 0 495
Hát, azért hogy a rovásírás nem csak renesszánsz kitalálmány, azt az jól bizonyítja, hogy valóban vitathatatlanul az ótörök írás jelkészletéből merít (mégpedig úgy tűnik természetes fejlődés útján, azaz nem csak a jelkészlet, de a jelek hagyományozott hangértéke is magyarázható (legfeljebb egy-két képzésmomentumban térnek el)! (Ezzel komolyan foglalkoztam). Az ótörök írás csak a XIX. sz.-ban lett ismeretes.

A rovásírás egyértelműen nem műtermék. Ha viszont megnézzük, hogy mire használták az ótörök birodalomban, és figyelembe vesszük, hogy a magyarok is törökös kultúrájú nép voltak, bizonyos, hogy nem úgy használták, mint mi ma az írást, hanem inkább a görögök monumentális írásaihoz hasonlóan pl. síremlékeken, stb., nem annyira üzenetekre. Az írástudók száma nem lehetett nagy.

Az vitathatatlan, hogy a renesszánszban igen felkapták, sajnos, az utóbbi évtizedekben is nagyon sokan, akik nem kellő tudományossággal foglalkoznak vele; rosszat is tesz a hírének.

Egyébként egy ismerősöm (nem publikált) kutatása arra utal, hogy nem volt, nem létezett az a közhiedelemben forgó Szt. Istvánnak tulajdonított rendelet, miszerint minden rovásírásos emlék elpusztítandó, amivel oly sokszor magyarázzák a leletek hiányát.

Ez is arra utal, hogy kis számú lehetett az írástudók száma, nem hétköznapi kommunikációra használták az ősi írást.

Ne feledjük! Még a legmegbízhatóbb korai forrásaink is inkább egyházi jellegűek! (a maradék meg renesszánsz tudós-szeretnék-lenni jelöltek "tankönyvszerű" [őket v.ö. a mai rovásírással foglalkozó "tudósokkal" és "gyakorlókönyv" stb. írókkal] lejegyzései).
Előzmény: rumci (462)
scasc Creative Commons License 2007.06.27 0 0 494
Itt sajnos félreértés folyik, és nagyon tisztelem Ádámot, de cáfolnom kell. Te a számítógépek által használt bit-bájt rendszert kevered az információelméleti bittel. Persze, a számítógép bite ugyanannyi információt hordoz, mint az információelméleti, ám a számítógép iszonyatosan redundánsan kódolja az szöveges információt a klasszikus kódolásokban. Az sem igaz, hogy az algoritmus gépkódját bele kellene számolni, ha információelméleti arányokról beszélsz.

Az információelmélet a matematika egy ágazata, egyébként nagyon fontos és aktívan, persze, a számítástechnikában alkalmazzák.

Leegyszerűsítve, a nebulónak X+Y+Z bitnyi információt kell megtanulniuk, ahol X = a [j] hangot tartalmazó szótövek száma, Y = a [j] hangot tartalmazó egyéb morfémák száma, Z pedig egy kicsi (tényleg!) szám, amely olyan információk bit(információ)-tartalmát hordozza, mint pl. hogy morfémahatáron ejtett [j] hiátustöltőt nem írunk (hogy a [mijért]-tel is tudjunk mit kezdeni).

Tehát az ly-lyel írt szavak számánál (ca. 500?) több bitnyi infót kell megtanulnunk (mert az adott [j] hangra kell ráhúznunk a tanult információt), de szigorúan számolva, információelméletileg, bitekben, akkoris legfeljebb néhány ezer.

Előzmény: Kis Ádám (493)
Kis Ádám Creative Commons License 2007.06.26 0 0 493

Az ly-t tartalmazó szavak nagyságrendje 102. Kellenek emellett az e gyéb morfémák is. A ragozási esetek szótárazhatók, de algoritmussal kereshetők is. Emellett azonban a j-t tartalmazó szvakra is szükség lehet. További probléma az ly-t nem ely-ként tartalmazó szavak listája is. Így ez együtt mondjuk n×103, ahol n <10. Ha egy szót átlag 4 karakternek tekintünk, akkor alulbecsült kompromisszummal 104 karakter méretű halmazzal van dolgunk. Ha egy karakter 8 bit, akkor kevésbé alulbecsült kompromisszum a 105 bit.

 

A tömörítés szerintem csak tárolás és szállítás során alkalmazható, a feldolgozás során nem.

 

 

Előzmény: flugi (492)
flugi Creative Commons License 2007.06.26 0 0 492
Ez nem lehet jó reprezentáció Ödönkének, ha minimalizálni akarod a tartalmaznivaló információt, mert feltételezel egy szótárat, amihez ezeket a biteket rendeled, ami szótár raktározásában bizony nem elég a szavak ismerete, hanem a sorrendjük/összerendelésük a lényeg, mert ugye az 500 bitet kb úgy érted, hogy "az első ilyen lehetséges szóban ly van, a másodikban j..". Hogy melyik-melyik, azt az igazán nehéz "megjegyezni".

Javaslok a további példálózáshoz egy épeszűbb hozzáállást, ami az ly-t tartalmazó szótövek végességét kihasználva egyszerűen ezeket a szavakat valamilyen kódolással tömörítve tartalmazza. Nincs más teendő, mint egy lexikon ly-t tartalmazó szavait becsomagolni valami jó tömörítővel, és máris van egy aránylag jó felső becslésed arra az információmennyiségre, amire Ödönkének tényleg szüksége van.
Előzmény: villamosjegy (471)
Kis Ádám Creative Commons License 2007.06.26 0 0 491
A kérdés nem az volt, hogy egy adott helyen ly van-e, vagy más, hanem az, hogy ly van-e vagy j.
Előzmény: ZsB (490)
ZsB Creative Commons License 2007.06.26 0 0 490
Najó, persze barátunknak abban igaza van, hogy az, hogy egy adott helyen egy [j] hang ly vagy nem ly, elvileg tényleg 1 bit információkülönbség. Csak azt nem veszi figyelembe, hogy 1 bit információkülönbség még nem információ, azt meg végképp nem, hogy műszakilag 1 bit különbséggel szart se lehet kezdeni. Azt meg, hogy biologice vagy mentálisan mit, még a jóisten se tudja.
Előzmény: Kis Ádám (488)
rumci Creative Commons License 2007.06.26 0 0 489
:D
Előzmény: ZsB (487)
Kis Ádám Creative Commons License 2007.06.26 0 0 488
Én meg mondjuk Prószékyvel, hogy miként lehet egybites különbségekre alapozva karaktert keresni. Ebbe Petyus is beszállhat.
Előzmény: ZsB (487)
ZsB Creative Commons License 2007.06.26 0 0 487
Mellesleg azé' szívesen összeereszteném 500 bites barátunkat, mondjuk, Szilágyi N. Sándorral, vittassa meg vele, mi a franc is az a szótő. Elég lesz csak a házak szóban, és csak fonológiailag...
Előzmény: rumci (484)
Kis Ádám Creative Commons License 2007.06.26 0 0 486

Ami a redundanciát illeti, egy ilyen szabályozáshoz semmiképp nem elegendő a létező alakok felsorolása.

 

479-ben említettem azt a lehetőséget, hogy nevekben, idegen szavakban lehetséges l+y digráf, amely nem j-nek ejtendő, hanem li-nek vagy lü-nek. Ezeket is ki kell szűrni.

 

Emellett illenék előre látni a helyesírási hibákat is. 

 

Egyébként az 500 bitbe például a morfológiai elemző program nehezen férne el. Ahhoz kell talán 520 is.

Előzmény: rumci (484)
Kis Ádám Creative Commons License 2007.06.26 0 0 485

Hát, ha arra gondolok, hogy az akadémia 1922-ben elfogadta ezeket az újításokat, és ekkor ismét egyesült a magyar helyesírás, felötlik bennem, hogy közben volt pár Balkán- és egy világháború, néhány forradalom, nem is beszélve a vérvörös csütürtökről.

 

Talán van összefüggés.

Előzmény: NevemTeve (483)
rumci Creative Commons License 2007.06.26 0 0 484
„nem minden szóra vonatkozik, hanem csak szótövekre.”
Pontosabban minden morfémára. Ezért is írtam először úgy, csak ismétlésként a közérthetőség oltárán feláldoztam a szabatosságot. Ugyanakkor biztos nagyobb redundanciára van szükség, mint elméletileg gondolnánk. Ha nem lenne, akkor ugyanis nem lett volna a nyolcvanas években nagy vita a csevej szó írásmódjáról, és nem írták volna komoly emberek is le, hogy a csevely a helyes írásmód. Pedig hát ez sem monomorfematikus szó, a cseveg-ből is kielemezhető fiktív csev- tőhöz járul az -Aj képző.
Előzmény: villamosjegy (476)
NevemTeve Creative Commons License 2007.06.26 0 0 483
*flame* Nem volt népszavazás sem? Nem vonultak ki a népek az utcára, hogy így "hülyén néz ki"? Tényleg olyan, mintha most abban élnénk, hogy lám, itt vagyunk a nyelv fejlődésének végpontján, innen már nem megyünk sehová.
Előzmény: Kis Ádám (481)
Kis Ádám Creative Commons License 2007.06.26 0 0 482
Megállapításaidat a nyelvtechnológusok nagy örömmel fogadnák. Javaslom, foglald írásba.
Előzmény: villamosjegy (478)
Kis Ádám Creative Commons License 2007.06.26 0 0 481

Írod:

Írtam is az imént egy példát: régebben a' határozott névelő lekopott z hangját írásban aposztrófával helyettesítettük, minden különösebb jelentés nélkül, pusztán megszokásból; azután, hagyomány ide vagy oda, szépen leszoktunk róla."

 

A lényeget illetően igazad van, csak nemm szomplán leszoktunk róla, hanem az okostojás nyelvészek szóvá tették, hogy ez felesleges, és javasolták, hogy ne tanítsák az iskolában. Ez egy csomagban volt a cz-vel. Miután a kulutszminiszter úgy döntött, hogy az iskolai helyesírásan elhagyják az aposztrófot, persze, hogy leszoktunk róla. Igaz, ez 1903-ban vol.

 

Előzmény: NevemTeve (480)
NevemTeve Creative Commons License 2007.06.26 0 0 480
Nem tehetnénk egy kicsit félre a biteket? Ennél talán fontosabb kérdés, hogy mennyi létjogosultsága van annak az érvnek, hogy "rosszul nézne ki, ha másképp lenne írva, mint ahogy megszoktam". Szerintem például semennyi, hiszen ugyanannyi (vagy kevesebb) idő alatt, megszoknánk az új írásképet, mint amennyi a régi megszokásához kellett...
Írtam is az imént egy példát: régebben a' határozott névelő lekopott z hangját írásban aposztrófával helyettesítettük, minden különösebb jelentés nélkül, pusztán megszokásból; azután, hagyomány ide vagy oda, szépen leszoktunk róla.
Kis Ádám Creative Commons License 2007.06.26 0 0 479

"Átgondolva a dolgot ebben is valszeg igazad van, bár nem minden szóra vonatkozik, hanem csak szótövekre. Vannak szabályok ugyebár, amelyek lehetővé teszik a tömörítést. "

 

 

Miért csak a szótövekre vonatkozik, a toldalékokra miért nem? Vigyázó szemed vesd a hasonulásra ("Folyjon ki a szeme, ha hellyel kínállak")

 

A másik része pedig a dolognak az, hogy a számítógép nem hall. A számítógép számára minden betűt egy számmal kódolnak. Az egyes betűk eltérhetnek egymástól egy-egy bitben, de az ly esetében két megoldás lehetséges: ha fonológiai alapon kódolják, akkor egy bájt terjedelmű, ha grafematikusan (miképp a UNICODE magyar táblázatban), akkor két bájt. Szerintem nincs értelme a j-ly különbségre koncentrálni, a számítógép számára az ly-t meg kell különböztetni az ábécé összes többi betűjétől.

 

Ekkor még nem beszéltünk arról az esetről, amikor az ly-t esetleg li-nek kell kiolvasni (Moholy-Nagy (?), lymphoma, Lysistrata, Lyon). Ez azért gáz, mert ez még a betűkódba sem fér bele, kiegészítőleg nyelvkódot is kell adni.

 

Persze, van egy olyan megoldás is, hogy alkalmaznak valamilyen fonetikus átírást, de abban a j és az ly jele szükségképpen ugyanaz lesz. Ezért jobb, ha az írott nyelv szintjén maradunk, mert ha a beszélt nyelvet kódolnánk, akkor nem lehetne a j-t és az ly-t megkülönböztetni.

 

 

Előzmény: villamosjegy (476)
villamosjegy Creative Commons License 2007.06.26 0 0 478
Nem, itt arról van szó, hogy ZXSpectrum Ödönkének hány bitnyi információt kell elraktároznia a kis buksijában ahhoz, hogy helyesen használja az elyt.
Nem túl sokat, ha nem is 500 (figyelembe véve azt, amit rumci írt), de max nehány ezer bitet.
Előzmény: Kis Ádám (477)
Kis Ádám Creative Commons License 2007.06.26 0 0 477
Kár elvinni erre a filozófiai síkra a dolgot. A nyelv ábrázolásának alapja a megfelelő kódrendszer. Két dolgot meg lehet különböztetni egy bittel, de itt nem két dolgot kell megkülönböztetni, hanem lényegesen többet. A teljes ábécét.
Előzmény: PETYUS (475)
villamosjegy Creative Commons License 2007.06.26 0 0 476
"Saussure óta ismerjük a zéró fokon való jelölést. Ergo ha a lexikonban megjelölöd az ly-os morfémákat, legalább zéró fokon megjelölted a j-seket is (a technológiai ügyeskedés információelméleti szempontból indifferens; különben is, mikor lenne 0 értékű nálad az�ellipszilonbit�?)."

Na ebben valszeg igazad van. Az elipszilon bit "nálam" akkor lenne nulla, ha a szó nem ly-os.

"Ergo minden olyan szót meg kell jelölnöd, amely tartalmaz /j/ fonémát "

Átgondolva a dolgot ebben is valszeg igazad van, bár nem minden szóra vonatkozik, hanem csak szótövekre. Vannak szabályok ugyebár, amelyek lehetővé teszik a tömörítést. Pl. Még véletlenül sem írnánk, hogy ne loply..., mert a felszólító mód jele nem ly, hanem j. Ja és lásd még amit a foly|ik és fojtról írtam.



(arról nem beszélve, hogy valójában nem is binaritásról, hanem terinalitásról van szó, hiszen a [mijért] szónál se j-t, se ly-t nem írsz)."

Ezt ne keverjük ide, ez egy ly-tól független probléma.
Előzmény: rumci (474)
PETYUS Creative Commons License 2007.06.26 0 0 475
> Alapvetően összekversz két fogalmat

Nem keveri össze.
1 bit pont ahhoz elég, hogy két lehetőség közül kiválasszuk az egyiket. Itt pedig pont erről van szó.
Előzmény: Kis Ádám (473)
rumci Creative Commons License 2007.06.26 0 0 474
Saussure óta ismerjük a zéró fokon való jelölést. Ergo ha a lexikonban megjelölöd az ly-os morfémákat, legalább zéró fokon megjelölted a j-seket is (a technológiai ügyeskedés információelméleti szempontból indifferens; különben is, mikor lenne 0 értékű nálad az„ellipszilonbit”?). Ergo minden olyan szót meg kell jelölnöd, amely tartalmaz /j/ fonémát (arról nem beszélve, hogy valójában nem is binaritásról, hanem terinalitásról van szó, hiszen a [mijért] szónál se j-t, se ly-t nem írsz).
Előzmény: villamosjegy (471)
Kis Ádám Creative Commons License 2007.06.26 0 0 473

Kedves villamosjegy!

 

Alapvetően összekversz két fogalmat, a bit-et és a bájt-ot. De sebaj, csak higgy magadban.

 

'gy már érthető, hogy miért nem értesz a dologból semmit.

Előzmény: villamosjegy (471)
villamosjegy Creative Commons License 2007.06.26 0 0 472
"2. Ötszáz bit.

Ha a most általánosan használatos kódrendszerből indulunk ki, az UTF-8 ból, akkor az ly ábrázolásához 16 bit kell (8 az l és 8 az y). Ha egy teljesen általános kódrendszerben gondolkodunk, annak maximális kihasználásával, akkor 32 (feltételezve, hogy ebben az esetben egytelen grafémaként kódolják. Ha nem, akkor 64).

Igenám, de elgendő-e az ly használatához a két alkotó betűt ismerni? Aligha. Ha a számítógép intellektuális képességeihez igazodva gondolkodunk, akkor bizony ismerni kell minden egyes szót, amelyben ly van, ráadásul külön-külön azokat a ragozott alakokat is, ahol az ly hasonulás folytán megkettőződik (hellyel). De ez még nem elég, a hangzási homonímia eseteiben a nem ly-os homonímákat is ismerni kell (foly... - foj...). Ezekben az esetekben azonban nem elegendő az ly 16...64 bitje, hanem a teljes szó, jó, engedek, a teljes lemma szükséges. Ez nem fér el 500 biten."

Hülyeség. Információelméletileg 1 bit a különbség. Indifferens, hogy egy betűt hány biten ábrázolok [elipszilon - nem elipszilon]. A hasonulás pedig egy egyszerű szabály. Ez nehány bit összesen az összes ely-es szóra.

"De ez még nem elég, a hangzási homonímia eseteiben a nem ly-os homonímákat is ismerni kell"

Ismerni kell a szótöveket. Ha azt mondom fojtogat, akkor tudom, hogy abban a fojt és nem foly|ik a tő. Itt a ly többlet információértéke 0 bit.
Előzmény: Kis Ádám (467)
villamosjegy Creative Commons License 2007.06.26 0 0 471
"Továbbra sem értem, hogy hogy jött ki az 500 bit. Részletezd."

Eccerű:

Hüj[elipszilonbitszabad]e = hülye
Hajó = hajó


Az elipszilonos szavak a jésekhez képest egy bittel hosszabak. Egy bit különbség van az információban a jés és ly-os szavak között.
Előzmény: Lájszló (466)
Kvász Ivor Creative Commons License 2007.06.26 0 0 470
Már miért lenne? A legismertebbek, akik két l-lel írják, a zeneszerző Szőllősy András és a fordító Szöllősy Klára. És "Nagyszőllős"-re is kiad a gugli 2920 találatot - régen ez volt a főalak, úgy emlékszem. De pl. "Medgyes" város nevében a Községi Törzskönyvbizottság is meghagyta annak idején a hagyományos írásmódot.
Előzmény: Mungo (469)
Mungo Creative Commons License 2007.06.26 0 0 469

Nos ebben a bo-dza, ma-dzag dologban valóban a bodz-dza, madz-dzag valahogy természetesebbnek tűnik.

(A természetes alatt most azt értem, hogy a kiejtés alapján gondolkodás nélkül ezt írnám le ösztönösen.) 

A problémát az okozza, hogy a magyar helyesírás majdnem fonetikus és ezért az írásképből a kiejtés viszonylag egyszerűen következik. (Talán ezért is bonyolult megtanulni más nyelvek írását-kiejtését.)

Azért kíváncsi lennék a véleményetekre a szőlő, szöllő ügyben. Mert a helységnevekben, családnevekben szöllő egyébként pedig szigorúan szőlő. Még akkor is, ha bizonyos helyeken kifejezetten szöllőnek ejtik.

 

Kis Ádám Creative Commons License 2007.06.26 0 0 468
Tegyük ehhez hozzá, hogy Thienemann szerint a rovásírás valójában epigrafikus írás volt, azaz nem tekinthető egyértelműen a ma is használatos fonematikus (grafematikus) írással azonosnak. Az a megállapításod, hogy ez reneszánszkori spekuláció, az valószínűleg a rovásírás fonematikus megfeleltetéseire irányult. Az epigrafikus írásról röviden annyit, hogy a célja nem gondolatokmközlése, hanem az olvasó emlékeztetése ismert dolgokra, illetve felismertetésre szolgál. Ilyenek a feliratok, amelyek többnyire helyettesíthetők képekkel, piktogrammokkal. A rovásírás is ilyesmi lehetett, adatok rögzítésére, esetleg közlésére szolgálhatott. (Ha igaza van Thienemannak)
Előzmény: rumci (465)

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!