Keresés

Részletes keresés

A hozzászólás:
villamosjegy Creative Commons License 2007-06-26 18:10:14 472
"2. Ötszáz bit.

Ha a most általánosan használatos kódrendszerből indulunk ki, az UTF-8 ból, akkor az ly ábrázolásához 16 bit kell (8 az l és 8 az y). Ha egy teljesen általános kódrendszerben gondolkodunk, annak maximális kihasználásával, akkor 32 (feltételezve, hogy ebben az esetben egytelen grafémaként kódolják. Ha nem, akkor 64).

Igenám, de elgendő-e az ly használatához a két alkotó betűt ismerni? Aligha. Ha a számítógép intellektuális képességeihez igazodva gondolkodunk, akkor bizony ismerni kell minden egyes szót, amelyben ly van, ráadásul külön-külön azokat a ragozott alakokat is, ahol az ly hasonulás folytán megkettőződik (hellyel). De ez még nem elég, a hangzási homonímia eseteiben a nem ly-os homonímákat is ismerni kell (foly... - foj...). Ezekben az esetekben azonban nem elegendő az ly 16...64 bitje, hanem a teljes szó, jó, engedek, a teljes lemma szükséges. Ez nem fér el 500 biten."

Hülyeség. Információelméletileg 1 bit a különbség. Indifferens, hogy egy betűt hány biten ábrázolok [elipszilon - nem elipszilon]. A hasonulás pedig egy egyszerű szabály. Ez nehány bit összesen az összes ely-es szóra.

"De ez még nem elég, a hangzási homonímia eseteiben a nem ly-os homonímákat is ismerni kell"

Ismerni kell a szótöveket. Ha azt mondom fojtogat, akkor tudom, hogy abban a fojt és nem foly|ik a tő. Itt a ly többlet információértéke 0 bit.
Előzmény:
Kis Ádám Creative Commons License 2007-06-26 15:49:22 467

Ez az úr elég rossz bizonyítványt állít ki magáról. Az egész magatrtása arra val, hogy politikus. Méghozzá aktuálpolitikus.

Egy csomó dolgot nem tud:

 

1. Népszavazás a nyelvről. Ilyen van.  Csakhogy nem vasárnap hajnali 6-tól este hétig, hanem évtizedeken, évszázadokon keresztül. Hanem úgy, ahogy a nyelvújítással történt: vagy 40 éven keresztül folyt, kitaláltak több tízezer szót, amelyből a magyar nyelvközösség megtartott vagy egyharmadnyit. Ez szavazás volt. Vagy pl. a 'cz' esete. A 19. század végéig így  rendelték írni a 'c'-t. Az emberek többsége megunta, ezért a főmagyartanár, aki egy olyasfajta nyelvész volt, mint akikről ez az úr véleményt alkot, azt javasolta, hogy ne írjunk többé cz-t. Az iskolák elfogadták, mert az emberek unták már ezt a fölösleges betűkettőzést, ezért az iskolai oktatásban 1903-tól nem használták. Aztán 1922-ben az MTA is belenyugodott.

Itt jön az, amit rumci írt: 1954-ben a nyelvészek javasolták az eltörlését, az akadémia Helyesírási Bizottsága (amelyben nincsenek a nyelváészek többségben) nem járult hozzá.

Ha elmenne ez az úr a nyelvészek fórumára, és ott ugyanezt előadná, hamar megérezné, milyen az, amikor egy virtigli nyelvész (nem olyan fél-nyelvművelők, mint mi) vagy megvetően átnéz valakin, vagy hülyét csinál belőle.

 

2. Ötszáz bit.

Ha a most általánosan használatos kódrendszerből indulunk ki, az UTF-8 ból, akkor az ly ábrázolásához 16 bit kell (8 az l és 8 az y). Ha egy teljesen általános kódrendszerben gondolkodunk,  annak maximális kihasználásával, akkor 32 (feltételezve, hogy ebben az esetben egytelen grafémaként kódolják. Ha nem, akkor 64).

Igenám, de elgendő-e az ly használatához a két alkotó betűt ismerni?  Aligha. Ha a számítógép intellektuális képességeihez igazodva gondolkodunk, akkor bizony ismerni kell minden egyes szót, amelyben ly van, ráadásul külön-külön azokat a ragozott alakokat is, ahol az ly hasonulás folytán megkettőződik (hellyel). De ez még nem elég, a hangzási homonímia eseteiben a nem ly-os homonímákat is ismerni kell (foly... - foj...). Ezekben az esetekben azonban nem elegendő az ly 16...64 bitje, hanem a teljes szó, jó, engedek, a teljes lemma szükséges. Ez nem fér el 500 biten.

 

 

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!