A magyar többkarakteres betűk önmagukban kevés problémát okoznak. A legnehezebb a hosszú mássalhangzók elválasztása. Emiatt nem kell rendszerváltozás.
A francia, angol, német példák esetében mindenütt a mássalhangzókat emlegetitek, és nem beszéltek a magánhangzókról. Kérdezem: az eu, eau, ou stb magánhangzócsoportok, melyek egyetlen hangot jelölnek, miért nem jönnek számításba? Mert a betűrendezés elvei eltérőek ezekben a nyelvekben. Tehát itt nem a karakterábrázolásról, hanem a betűrendezésről van szó.
Más a helyzet a számítógépes ábrázolás esetében. Itt a baj abból következik, hogy a betűkódolás először az angol nyelvre jött létre, és folytonos számláláson alapul. A=65, B=66 stb.A más nyelvek sajátos betűit nem lehet ebbe a soba beilleszteni, hanem máshol (pl. 128 felett) keletkező üres területekre lehet őket elhelyezni. Ez annyiban okoz zavart, hogy a "más" nyelvek nem tudják a betűrendezést a természetes számok sorrendjére alapozni.
A legújabb betűábrázolás, az UNICODE a világ minden betűjének leírására alkalmas, és amennyire tudom, közel 20000 szabad lehetőség még van benne. Ezért arra is van lehetőség hogy a többkarakteres betűinkenek a számítógépen egy-egy kódolt alak felejen meg. Ma a CS kódszinten =C+S (azaz 4 bájt), ugyanakkor például a horvát kaitális dzs-nek csak egy (azaz két bájt: 01BA;01C4). Ugyanez a dzs többi változata esetében is így van.
Ezt a homogenizálást a magyar nyelvben is el lehetne végezni, hogy miért nem foglalkoznak ezzel a dologgal, nem tudom. Talán van valami összefüggése azzal a ténnyel, hogy a UNICODE weblapon a What is Unicode? című részben 33 nyelven olvasható a UNICODE leírása (az amharától a welsh nyelvig), de magyarul nem.
Kis Ádám
|