Keresés

Részletes keresés

A hozzászólás:
Tecs Creative Commons License 2003-05-23 17:29:55 33
"A legújabb betűábrázolás, az UNICODE a világ minden betűjének leírására alkalmas, és amennyire tudom, közel 20000 szabad lehetőség még van benne. Ezért arra is van lehetőség hogy a többkarakteres betűinkenek a számítógépen egy-egy kódolt alak felejen meg."

A dz és a dzs kivételével nem is kellene új helyeket lefoglalni. Említetted a huszita ábécét - a mai cseh karakterek is alkalmazhatóak lennének.

Nézzük a tendenciát! Talán rád is igaz, amit én elmondhatok magamról: a kézírás már nehezemre esik, annyira rászoktam a billentyűzetre. A következő lépés, hogy már csak diktálni fogunk. A szöveget meg mindenki úgy jeleníti meg, ahogy akarja - hagyományosan vagy cseh betűkkel vagy cirill átírásban.

Ezzel be is látom, hogy a többkarakteres betűk kérdését kár feszegetni, viszont a szabályok formalizálását, algoritmizálhatóságát még a korábbinál is fontosabbnak tartom.

Előzmény:
Kis Ádám Creative Commons License 2003-05-23 16:59:24 31
A magyar többkarakteres betűk önmagukban kevés problémát okoznak. A legnehezebb a hosszú mássalhangzók elválasztása. Emiatt nem kell rendszerváltozás.

A francia, angol, német példák esetében mindenütt a mássalhangzókat emlegetitek, és nem beszéltek a magánhangzókról. Kérdezem: az eu, eau, ou stb magánhangzócsoportok, melyek egyetlen hangot jelölnek, miért nem jönnek számításba? Mert a betűrendezés elvei eltérőek ezekben a nyelvekben. Tehát itt nem a karakterábrázolásról, hanem a betűrendezésről van szó.

Más a helyzet a számítógépes ábrázolás esetében. Itt a baj abból következik, hogy a betűkódolás először az angol nyelvre jött létre, és folytonos számláláson alapul. A=65, B=66 stb.A más nyelvek sajátos betűit nem lehet ebbe a soba beilleszteni, hanem máshol (pl. 128 felett) keletkező üres területekre lehet őket elhelyezni. Ez annyiban okoz zavart, hogy a "más" nyelvek nem tudják a betűrendezést a természetes számok sorrendjére alapozni.

A legújabb betűábrázolás, az UNICODE a világ minden betűjének leírására alkalmas, és amennyire tudom, közel 20000 szabad lehetőség még van benne. Ezért arra is van lehetőség hogy a többkarakteres betűinkenek a számítógépen egy-egy kódolt alak felejen meg. Ma a CS kódszinten =C+S (azaz 4 bájt), ugyanakkor például a horvát kaitális dzs-nek csak egy (azaz két bájt: 01BA;01C4). Ugyanez a dzs többi változata esetében is így van.

Ezt a homogenizálást a magyar nyelvben is el lehetne végezni, hogy miért nem foglalkoznak ezzel a dologgal, nem tudom. Talán van valami összefüggése azzal a ténnyel, hogy a UNICODE weblapon a What is Unicode? című részben 33 nyelven olvasható a UNICODE leírása (az amharától a welsh nyelvig), de magyarul nem.

Kis Ádám

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!