Ez kezd izgalmassá válni. Se a magyarban, se az angolban nincs olyan szó, ami a UNICODE-ban sorszámmal ellátott karakterek közül azokat jelentené, amelyek nyomdafestéket fogyasztanak?
Találjunk ki ilyen szót, mert nélküle nem tudunk beszélni az ábécé-sorrendről. A pixéma (esetleg pikszéma) hogy tetszik?
Nem tiszta a terminológia. A karakter megfelelhet egy-egy betűjegynek, avagy - ha a beszélt nyelv felé vetítjük - teljes szónak is: a számjegyek teljes szavakat jelölnek. Ezen kívül, az UNICODE és a többi számítógépi kódrendszer ún. vezérlőkaraktereket is tartalmaz, amelyek nyelvi megjelenítése szintén egy-egy szó, illetve esetleg szerkezet. Az AkH terminológiája magától értetődő (?) módon a számítógépes szövegmegjelenítésre nincs tekintettel. Épp ezért, én sasc terminológiai alapvetését nem tekinteném véglegesnek: a karakter tágabb fogalom a betűnél. Ugyanakkor úgy gondolom, hogy a graféma az a karakter megjelenített képe. Így a 00b6=ś, és van egy sor ún. nem nyomtatható karakter. Ezek grafikus formája is graféma. A Wikipedia szerint a graféma az írott nyelv elemi egysége, így betűírásban a betű, az ideografikus írásokban az ideogramma, és természetszerűleg idetartoznak a számítógépes karakterek is.
Ha a dolgot a karakter felöől nézzük, és a grafémát a karakter grafikus képeként értelmezzük, akkor az sz nem lehet graféma.
A klasszikus ligatúrákon kívül a ritkább latin betűs írásokban más ligatúrák is vannak.
Köszönöm, ez így egyértelmű és világos. Legközelebb majd karaktert mondok, ami itt a betűjegynél is jobb szó. Jelenthet írásjelet, számjegyet (sőt szóközt) is., vagyis mindent, amit a legkülönfélébb címszavak abc szerinti rendezésekor figyelembe kell(ene) venni.
A latin írás két betűjegyű karakterei a Unicodeban kizárólag korábbi kódrendszerekkel való 1:1 átírásával indokolt kompatibilitási karakterek, valóban ilyen a holland eredetű "ij" (ij), ilyen a jugoszláv eredetű "dž" (d), "lj" (lj), "nj" (nj). Az utóbbiak feltehetőleg valamilyen régi jugó kódrendszerből származnak, ahol ezek a glifák a ugyanazon a helyen voltak, mint a cirill џ, љ, њ, és így egyszerűen lehetett cirill ill. latin szerbhorvát helyesírásban megjeleníteni a szöveget a terminálon.
Az idézted "œ" azonban, akárcsak az "æ" nem tartozik ezek közé. Ezek történetileg valójában egy digráfból keletkeztek, ám szinkron, akárcsak a német "ß" már önálló betűk.
"Végre van egy szép szavunk, a graféma. Jelentse már ez egyértelműen azt a legkisebb egységet, ami nyomtatott szövegben előfordulhat. Tehát: 1 betú, 1 számjegy vagy 1 írásjel (1 karakter). A zs tehát 2 graféma, ami a magyarban legtöbbször 1 fonémát jelöl. Legalábbis szeretném, ha ez így lenne igaz,"
Lehetne, fautas, csak minek?
Minek, amikor a nemzetközi, sőt aktuális szabványokban pont, hogy fordítva használják a kifejezést!
Az Unicode világában és a modern angol nyelvű irodalomban a "grapheme" (graféma) nem egy írás (script) hanem egyes nyelvek helyesírásainak (orthography) a tulajdonsága. Az írás (script) legkisebb egységét "character"-nek hívják.
Így konkrét példaként a cseh ch-t egy grafémának nevezik, amely két karakterből (c+h) áll, stb.
Teljesen logikusan következik, hogy e terminológia szerint a magyar pl. sz egy graféma, amely s+z karakterből áll. Ilyen értelemben viszont egyértelmű, hogy a graféma = AHSz. betű fogalmának felel meg, a karakter pedig az AHSz betűjegy fogalmának.
A magyar helyesírás sz+sz = ssz tulajdonsága pedig grafotaktikai szabály.
Egyébként az AHSz terminológiája teljesen egyértelmű szakszövegben, csak a köznyelv, amely a betűt a betűjegy szinonímájaként _is_ használja, okozhat félreértést.
Az iskolában azt tanultuk, hogy mindkét forma helyes: "borjú, bárány béget" (Arany); csaplár és csaplárné nagyokat alhatnak" (Petőfi), ezek voltak az iskolapéldák.
Sziasztok! Melyik változat a helyesebb? Itt nyugszik XY és neje XY-né, vagy itt nyugszanak XY és neje XY-né? Tehát nyugszik vagy nyugszanak? Mindkét variánst láttam már sírfeliraton. A nyugszanak tűnik logikusnak, a többes szám miatt, viszont a "nyugszik"-kal valamiért nem vagyok kibékülve, lehet, hogy hierarchiát magyarázok bele?
Szerintem a -nő nem képző, a tanárnő, ápolónő, doktornő, varrónő összetett szó. A foglalkozásnevek önmagukban elsősorban ma is férfit jelentenek, ilyenkor a nemet nem kell külön jelezni. Megtoldva az úr szóval, a nagyobb társadalmi rangot jelentő foglalkozásnevek terjedtek el megszólításként.
A nőknél más lehetett a sorrend. Előbb a -nő utótagú összetételek jöttek létre, és a rangosabb szakmát jelentő, már meglevő, -nő utótagú összetett szavak váltak megszólítássá.
A zs tehát 2 graféma, ami a magyarban legtöbbször 1 fonémát jelöl. Legalábbis szeretném, ha ez így lenne igaz
Ez elhatározás kérdése. Például a ne tudom milyen nyelvben előforduló nem tudom milyen hangot a d betűkettős jelöli, amelynek egyetlen UNICODE felel meg, tehát vannak, akik úgy gondolják, hogy emiatt ez egy graféma.
Lényegében ezt a kérdést veti fel rumci: három dolgunk van: fonéma, graféma, karakter. Magyarul ezek szerint megkülönböztetjük a betűt, a betűjegyet. Ezen kívül van még a glif.
Ha jól értem, a zs úgy is felfogható, hogy az nem két betű, hanem egy betű (a z) és egy glifa, azaz ugyanolyan konstrulció, mint az o és az ö. Persze, ez elhatározás kérdése.
Ez a terminológia valóban kialakulatlan. Ezért nem is mondom meg, hogy betű-e vagy betűjegy - az a lényeg, hogy a UNICODE nem tartalmaz sz karaktert, csak s-t (0073) és z-t (007A). Két betűjegeys(?) karakter a Latin Extended A-ban az IJ-ij (00132-00133), illetve a 0152-0153 jelű Œ-œ ligatúra. A latin Extended B-ben több ilyen van. Tehát a *kócság (kóc + sÁg képző) és a kócsag számítógépi kódolt alakja csak az a-á szerint különbözik.
Más részről ez a kétértelműség számítógépen kezelhető.
A zavar forrása az, hogy az iskolai magyar nyelvtan erősen összemossa a betű és a hang fogalmát, betűként (és nem több betűvel jelölhető hangként) tanítja a cs-t, dzs-t, ..., zs-t.
Végre van egy szép szavunk, a graféma. Jelentse már ez egyértelműen azt a legkisebb egységet, ami nyomtatott szövegben előfordulhat. Tehát: 1 betú, 1 számjegy vagy 1 írásjel (1 karakter). A zs tehát 2 graféma, ami a magyarban legtöbbször 1 fonémát jelöl. Legalábbis szeretném, ha ez így lenne igaz,
Mivel az abc-előírta sorrendet nem beszédben, hanem írásban alkalmazzuk, én azt tartanám jónak, ha a sorrendet a grafémák határoznák meg, és nem a fonémák. A kétféle abc (szótár vs. lexikon) együttélése szerintem felszámolandó. Ezzel indítottam a vitát (8307).
Tömörítve: vesszen a szótárak abc-je, éljen a lexikonoké!
A UNICODE szerintem is csak a grafémák képi megjelenítését segítő rendszer, az abc-be rendezés szabályaival csak nagyon lazán függ össze. Persze szerencsés kivétel a latin és az angol.
Az a logika, hogy ezeket a váltakozásokat teszi fel: tanár ~ tanárnő, tanár bácsi ~ tanár néni, professzor ~ professzor asszony, tanár úr ~ tanárnő 0. Tehát foglalkozásnevek egybe, megszólítások külön. Egybeeséskor meg lehet zéróval operálni.
Mit értesz grafémán? Betűt vagy betűjegyet? Tehát az sz-t egy vagy két grafémának számlálod? (Azért kérdezem, mert mindkét szóhasználattal találkoztam már, és nem egészen egyértelmű számomra, mire gondolsz. Arra, hogy míg van a dj glifának unikódja, a sz glifának nincsen, vagy arra, hogy vannak olyan többjegyű betűk, amelyeknek van unikódjuk?)
Annak a veszélyével, hogy mellébeszélek a dolognak (nem olvastam végig a hsz.-eket):
A Unicode nem írja elő a szavak sorrendezését, mindig hangsúlyozzák, hogy nem feltétlenül a unicode szerinti bináris sorrend a helyes, hanem hogy nyelvek, sőt alkalmazások szerint (l. lexikon vs. szótár, stb.) "unique collation algorthims"-t kell (ill. lehet) alkalmazni.
Nem biztos, hogy bármi jelentősége lenne az én állásfoglalásomnak. Viszont a UNICODE-ra tett utalásom tükröz egy állásfoglalást: ha a nemzetközi szabvány a magyar nyelvű szövegeket a grafémák szerint kódolja, akkor állást lehet foglalni a ccs>>cs>>cz ügyben. Úgy tűnik, hogy az UNICODE sikertörténet. Persze, az Akadémiánk sokáig szokott szembemenni, (l. c-cz, 1903-1922).