Nicaragua. Nahát! Én soha nem ejteném magyarul /nikaragva/-nak, csak /nikaragua/-nak; ugyanakkor /urugváj/-t meg /paragváj/-t mondok.
Dessewffy, Nietzsche, Grossauer. Csak az elsőnél működhet a 4. szabály, ugyanis a csak magyar ul (de azt ideálisan) tudó beszélő számára (márpedig a helyesírási szabályzatban az összetétel mindvégig ilyen alapon definiáltatik) a második két szó egymorfémás, míg az első kétmorfémás.
Az 1. miért rendelkeznék a Staroměstóról, schismről? Nem értem.
„Mindenképpen kellene egy pótszabály, amely megvédi a lj, mb és gu digráfokat.” Nem tudom, hogy pótszabály-e, szerintem talán a 2.-be belegyömködhető. Mindenesetre egész más védi a lj, mb típust, mint a gu-t. Az első típus ugyanis egy hang, mégha a magyar hangrendszerben meg nem található is. A harmadik viszont azért marad egyben, mert nem a /v/ hang jele az u, hanem a /gv/ hangcsoporté a gu (bár ha egy labioveláris explozíva?), azaz az u-t (csak) azért olvasom /v/-nek, mert előtte g van (tipikus szótagon belüli hangkapcsolódási szabályszerűség: egyben kell őket tartanom, mert különben hibás a kiolvasás). Ez viszont azt igazolja, hogy a mě-t is egyben kell tartanom, mert különben más kiolvasást eredményezne, még inkább a tzsch-t, mert ha szétszedem, akkor a gyanútlan olvasó kimond egy /c/-t, s utána kell korrigálnia (a mě, gu esetében még menthető a helyzet, ha van memóriája).
A tartsáról szerintem már elmondtam a tőlem telhetőt, de átfogalmazva: a 2.-ben a kiejtés szerinti nem a fonetikusan, hanem fonematikusan értendő. A Nietzschében viszont nincs szó (a magyart tekintve) összeolvadásról, ugyanis az csak morfémahatáron (de gondozott beszédben összetételi határon nem) jelentkezhetik. A Nietzsche viszont magyarul egymorfémás szó.
A cseh ě három különböző "hangot" jelenthet: /'e/ (egy hang, amely lágyít), /je/ (azaz /j/+/e/), /nye/ (azaz /ny/+/e/). Bár az aktuális realizálást valóban a megelőző hang dönti el, de ennek ellenére ez /e/ "prefixe" teljes mássalhangzó. Ugyanez a jelenség "okozza" a Ljubljana második lj-jét. "Lágy" ajakhangok pl. az oroszban sem állhatnak epentetikus lj nélkül, a szláv nyelvek pedig tradícionálisan a követő magánhangzóhoz kapcsolják a "lágyságot". Ennek intrafonémikus jellege észre is vehető pl. az orosz igeragozás során ljubity < ljublju, kupity < kuplju és drematy < dremlju.
Történeti okok miatt a cseh a /j/+/e/ hangkapcsolatnál egy grafémát használ, míg pl. a /j/+/a/-ra kettőt, vö. pět /pjet/ 'öt' ~ pjat /pjat/ 'kinyújtani'.
Ha a latin nyelvű neveket is átírnánk, mint a horvátok, úgy sou-těž mellett azonos szú-tyezs lenne, de már prů-běh mellett eltérő prúb-jeh és vý-měna mellett eltérő vím-nyena.
Igen felesleslegesnek látszik konkrét elválasztási szabályokat erőltetni az idegen szavakra, amikor jelentősen eltérő gyakorlatok vannak, pl. az egy graféma > több hang és a kiíratlan hangok. Mert bár kényelmes az általad adott #szótag = #mgh. definíció, de mi a magánhangzó. A schism-ben éppen kettő van: ha átvettük volnak, mint a file > fájl-t, akkor most pl. skizem-et írnánk. Akkor működik tehát, ha #mgh := {[magyarban is ilyen hatást keltő] magánhangzót jelentő graféma}.
Ugyanakkor az ezzel ellentétes #mgh := {[magyarban is lehetséges] magánhangzót jelölő fonéma} definícióra jutunk, ha a francia boule-vard-t /bulvár/ vesszük. (Ugyan csak addig, amíg nem hallgatunk Piafot, vagy retorikus stílusú előadást: /bulövár/.)
Ha már előkerült a héber, abban is előfordul a tiberiási söva nah (csendes svá) diakritikus jel, amely a magánhangzó hiányát jelzi (vö. Jiu-jitsu > g'iu-g'itöszu.
Tehát állítom, hogy idegen szavakat most sem a szótagolás elve alapján választunk el, hanem a szótag percepciója alapján, amit elsősorban a grafikai kép vezérel.
Ugyanakkor írod: a ljbetűt összetett betűnek tekinti a szabályzat. Ez nincs rögzítve, ugyanúgy csak a Ljub-lja-na példából derül ki, mint a Nietz-sche. A szabály ez: "(AkH 230. b) Az egy mássalhangzót jelölő betűcsoportokat ... nem választjuk szét". Nem definiálja, hogy mi egy mássalhangzó, ezt az átadó nyelv implikálja. Emiatt a lj digráf egy mássalhangzó, jóllehet a magyar két mássalhangzónak ejti, a tzsch pedig két mássalhangó, holott a magyar egy mássalhangzónak ejti.
És most jönnek a "csemegék":
- A Nicaragua szóban nem választhatunk Nicarag-ua szerint, jóllhehet a magyar ejtés /ni-ka-rag-va/, de a natív ejtésben is az itteni u ejtése ugyanolyan, mint az arribab-je. Egy nyelvtörténeti béklyó (a latinban a gu egy mássalhangzó, labiálisan ejtett g volt) le nem írt kivételt okozt a szabályban: csak ez annyira megszokott, hogy fel sem tűnik.
- A bantu nyelvekben pl. az mb, nd és ng betűkapcsolatok egy hangot jelölnek: nazalizált zöngés zárhangokat, így a kikuju nyuumba szótagolása nyuu-mba.
- Kikapcsolódásként válsszuk el a nauhtzontli szót.
És te hoztad az általam nem talált példát, hogy a magyar szavaknál is szükséges a megoldáshoz "a priori" ismeret, nevezetesen a Kristóffy-t. Én ezt a szintuációt a Pappal > Papp-pal példával akartam korábban érzékeltetni, de úgy látszik nem átütő sikerrel.
A Kristóffy ugyanis a Kristóf + fi(a) szerkezetből etimologizálható (ejtése is /kristóffi/, míg a Desseöffy a Dezső + fi(a)-ból /dezsőfi/.
Ez utóbbit én gyermekkoromban /deseffi/-nek olvastam ki (n.B. Nekem még a mai napig a Jósika vezetéknév /jósika/ és nem /józsika/). Aztán az iskolában megtanítottak a helyes ejtésre. Ugyanígy kellene a Nietzsche névvel is eljárni. Az egyértelműség hiánya, a fedettség még nem ad feloldást. A kérdés, hogy előírhatjuk-e a Desseö|ffy morfémahatárt, míg a Nietz|sche-t nem. Mennyivel magyarabb az előbbi? Vegyünk pl. egy Grossauer magyar vezetéknevet; a Gross- után érvényesíthetjük-e 4. szabályodat?
Ugyanakkor az 1. pontod nem csak az ésszel > *észszel-ről rendelkezik, de a Staroměsto > *Staromňesto-ról vagy a schism > *schissem-ről is.
Ezen túlmenően a 3. szabályod következménye Ni-ca-rag-ua, nyuum-ba, sőt továbbra is tartom, hogy Ljubl-jana; minthogy a kiejtés alapján szótagolsz és csak utána felelteted meg a fonémákat a grafémáknak.
Mindenképpen kellene egy pótszabály, amely megvédi a lj, mb és gu digráfokat. Ha már van ilyen pótszabály, akkor nincs érv az ellen, hogy a tz-sch szétválasztásra is kiterjedjen: hasonlóan ahhoz, hogy az 1. pont bontást, a 2. pont összevonást ír elő.
Ja, és mi a helyzet a tartsa szóval? Vezessük le:
1. Egyszerűsítés feloldása: tartsa /t.a.r.cs.a/ változatlanul
2/a. Kiejtés szerinti szótagolás: tartsa > /tar-csa/!
2/b. Hang-betű megfeleltetés: /t.a.r.cs.a/ ~ t.a.r.ts.a 2/c. 2/b-be helyettesítés 2/a alapján: tar-tsa 3. Kettős mássalhangzó-graféma korrekciója: tar-tsa változatlanul
4. Morfémahatár korrekciója: tar-tsa változatlanul (*cső-stül-nél sem érvényesül)
De ha azt mondod, hogy az egyszerűsítés feloldása a teljes asszimilációra is vonatkozik, akkor azt mondom, legyen /t.a.r.t.s.a/, de akkor /n.í.c.s.e/ is.
Q.E.D.
A szláv (itt értsd: szlovák) elválasztás csak látszólag megengedő, ugyanis elsődleges elve a morfémahatáron való elválasztás, és ez a magyarnál szélesebb értelmezésű, így a mássalhangzóval kezdődő szuffixumok mindegyike "számít". Emiatt látszólag magyaros megoldások születnek: pl. m. lord-dal ~ szlk. lord-mi 'lordokkal' (de nem m. *cső-stül), illetve m. hagy-juk ~ szlk. opus?-me 'u.a.' (de nem m. *tegy-ük).
[Igaz, most modulálnom kell a korábbi hozzászólásomban elmondottakat: a magánhangzóval kezdődő ragok és képzők nem alkotnak morfémahatárt, valamint a nem szótagos prefixumok (igekötők) sem, emiatt otec+ami > otcami > ot-ca-mi. Az összetételi határ és a "testes" prefix mindig "forró", pl. Brati-slava és prí-krasa.]
Lehet, hogy félreérthető voltam a rétorománnal... Úgy döntöttem akkor, hogy végigveszek minden indoeurópai nyelvet, még akkor is, ha "látszólag" latin betűs. Ez volt a szerencsém :-), mivel edig en bloc "kidobtam" a germán és az újlatin nyelvek összességét.
Részeletes elemzéskor pedig kiderült, hogy rétoromán egy nyelvjárását pedig úgy hívják, hogy ladin, ettől egy ugrás a ladino, amely zsidók által használt nyelv (volt), és úgy viszonyul a kasztíliaihoz, mint a jiddis a felnémethez... Hoppá, jiddis! [De persze már az iráni nyelveknél beugorhatott volna a tát, avagy zsidó perzsa.]
Ezért említettem a rétorománt, aminek az ortográfiájával egyébként sokáig bajom volt. Nekem a surmiran rumantsch (oberhalbsteini rétoromán) nyelvjárásról vannak részletesen adataim német nyelven. Itt a tg digráfot úgy definiálják, hogy ugyanúgy kell ejteni, mint az olasz spicciolocci-jét; a tsch betűkapcsolatot viszont fontos megkülönböztetni a tg-től és ugyanúgy ejtik, mint a németben.
Ez sokáig egy feloldhatatlan ellentét volt nekem, hogy ugyanazt a hangot, hogyan lehet megkülönböztetni egymástól... Idővel kiderült, hogy a tsch megfelel a magyar /cs/-nek, míg a tg a /csj/-nek, vagyis a Milosević utolsó hangjának. Lám, a német nem ismeri a /ty/ hangot, különben arra hivatkoztak volna, nem az olasz /cs/-re.
De kissé vissza a héberhez: utána néztem, az ivrit (modern héber) nem követi a jiddis hangjelölését, inkább visszatér az "egy betű - egy hang" elvhez: bevezettek egy új diakritikus jelet, a betű után írt "aposztróf"-ot. Ez hasonlóan, a "csehes" hacsekhoz "meglágyítja" az alapjelet: /zs/ = {z} + {'}, /cs/ = {c} + {'}, /dzs/ = {g} + {'}.
(N.B. Túró Rudi mindig van a hűtőben: a gyerekek a zselést szeretik...)
Gratulálok! Ez így is szép volt. (Azt sajnálom, hogy mások bele se próbáltak szállni a játékba.)
Köszönöm a sört, de – ha szabad – elcserélném fagyira vagy Túró Rudira, mert ezeket legalább szeretem is, szemben a sörrel, melyből életemben mindössze egy kortyot bírtam megkóstolni.
Akkor jó, hogy nem jelöltem meg, hogy germán nyelv a kitalálandó, az túl sok könnyítés lett volna, és így is sikerült.
Arról, hogy – legalábbis szerintem – messze triviálisabb a megoldás, mint amikre korábban gondoltál, OFF eszembe jutott az a barkochba- (hogy már fajnál maradjunk! :-)) ) feladvány, amellyel legjobban sikerült valaha is megizzasztanom embertársamat, ez nemes egyszerűséggel az ég (fn.) volt, s onnantól kezdve volt szinte lehetetlenség megfejteni, hogy:
– Tárgy?
– Is.
– Fogalom?
– Is.ON
Azon töröm a fejem most viszont, hogy milyen latin betűn kívüli írás köthető a rétorománokhoz, de semmi nem jut az eszembe. (Bár gondolom, a smiley hiánya ellenére ezt nem kell szó szerint vennem.)
Sajnálom is, mert abból rögtön kettő is lett volna. :-))
I. 7. b-c) Szerintem igen változó az ejtés. Éppen ezért nyugodtan támaszkodhatunk a #szótag = #mgh. elvre.
7. d) E kérdésben erősen hátrányos helyzetű vagyok hozzád képest, de a ě nem pusztán /je/-t jelöl? És akkor a nazalitás a megelőző mássalhangzóból terjed csak tova? Mert akkor a /ń/ hang egyik fele a m, másik fele pedig a ě betűből adódik. Kérlek, cáfolj, ha hülyeséget mondanék. A Richárdot azért hoztam ide példaként, mert két betű = egy hang, szemben a fixen egy betű = két hang megfeleltetésével.
2. bek. Magyarán (ez a teljes magyar elválasztás algoritmusának vázlata akar lenni): 1. ha volt az elválasztandó szóalakban egyszerűsítés, feloldjuk; 2. a szót kiejtés szerint leszótagoljuk (minden szótagot pontosan egy magánhangzó alkot, ha két magánhangzó egymásra következik, közéjük kerül az elválasztójel, ha van köztük mássalhangzó, mindig pontosan egy kerül az elválasztójel után – mindezek kiejtés szerint értvék!), a hangokat megfeleltejük a betűknek, és ennek megfelelően írjuk vissza a kötőjeleket; 3. ha elválasztójel után két azonos graféma (itt már az írás számít) található, az elválasztójelet közéjük léptetjük; 4. ha bármely elválasztójelet megelőző és követő magánhangzók között tőmorféma kezdődik, vagy kötőjel (nem elválasztójel!) van, az elválasztójel erre a helyre kerül.
NB. 1. A lépések sorrendje fontos, ez magyarázza ugyanis pl. a Des-sew-ffy elválasztást: /ž/ értékű ss ezért választódik szét, egyben marad viszont a /f/ értékű ff, mivel összetételi határ előzi meg. Ezek után persze rejtély a Kristóffy helyes elválasztása, lehet ugyanis > Kristó + ffy és > Kristóf + fy egyaránt.
NB. 2. Komolyabb bizonytalanságot a 2. és a 4. pont okozhat, az utóbbi azzal, hogy összetétel-e valami vagy nem, az előbbi pedig a normatív kiejtésre való hivatkozással, noha ez a mai napig nem kodifikáltatott az írásnormához mérhető igénnyel. (Az 1. is okozhat persze gondot a karosszéria-típus esetében, de ezek száma elhanyagolható.)
Nekem ezek alapján, melyek szerintem párhuzamban állnak a te elveiddel, legvalószínűbben a Nie-tzsche alak jön ki, feltéve a /níče/ kiejtést (a /ničče/ ejtést szubsztenderdnek szokták tartani, hogy az milyen elválasztást hozna, számomra kétségesebb, de ott a másik megoldást valószínűsíteném).
II. Az ellentmondás feloldása: a lj betűt egy összetett betűnek tekinti a szabályzat (mint pl. a ch-t, ezért nem tartja szétválaszthatónak); ebben talán valami ly iránti vonzalom is meghúzódik.
III. Érdekes. Szláv nyelvek elválasztása közül csak az oroszt meg a lengyelt ismertem, és mindkettő nagyon megengedő, azaz a legtöbb magánhangzó között számos helyen elválaszthatunk: V-C=C-CV (az = jellel megjelölt a preferált hely azonban, ha nem szól bele morféma- [vagy összetételi?] határ). Buta módon azt hittem, hogy a többi szláv nyelv is nagyjából így csinálja (amúgy ha minden jól megy, épp hétfőn kerül kezembe orosz meg cseh [csehszlovák?] helyesírási szabályzat).
IV. Az a kérdés, hogy az elválasztás tipográfiai vagy helyesírási elvét tekintjük-e. Amit te mondasz, az a tipográfiai elve; szemben a helyesírási elvével, mely a szótagolás. Nem véletlen, hogy helyesírásilag teljesen szabályos az i-de-i elválasztás, ami tipográfiai nonszensz. Arról nem beszélve, hogy valószínűleg könnyebb összerakni a valódi szótagszerkezetnek inkább megfelelő tem-plomot a temp-lomnál, bár itt felmerül a kitalálhatóság elve is, ami a „maximalizáld a szótagkezdetet!” elvének éppen ellentmond a „maximalizáld a kódát!” elvével (vö. rövidítések, becézés, játszi szóképzés).
Amúgy a Nietz-sche elválasztás mellett korábban én is csak az esztétikai (= tipográfiai) szempontokat tudtam felhozni (bár a tőled megtudottak alapján most már szinte biztos vagyok benne, hogy megfontolás nélkül átmásolták valami német elválasztási szójegyzékből).
Fizetek egy sört, ha találkozunk, a feladványodért. Már a rétoromán nyelvjárások ortográfiai problémáinál jártam, amikor belém döbbent, hogy milyen szűk látókörű (vagy tudatalatti faji amnéziával terhelt) vagyok...
A megoldás: a jiddis használja a /z/ + /s/ héber betűk kombinációját a /zs/ hang rögzítésére (természetesen jobbról balra).
Mindenesetre sajnálhatod, hogy ilyen hamar kitaláltam: a glagolita írásról való elmélkedésemről lemaradtál :-)
Nagyon szomorú vagyok magamtól, úgy gondoltam, hogy a glagolita, a lineáris A és B kivételével az összes európai indoeurópai alfabétumot letudtam. Miután válaszoltam a másik vitaszálra, száműzöm magam könyvtáram hűvösébe...
Nos, az elválasztás kapcsán szándékosan Nádasdy-féle provokatív hangnemben fogalmaztam. Mindennek hátterében annak "kidomborítása" áll, hogy felesleges a Nie-tzsche levezethetőségére hivatkozni, amikor a szabályrendszer és a gyakorlat egyaránt önellentmondással terhes. Ennek legfőbb oka, hogy kevert a "szótagfelfogás", azt hol a grafikai kép, hol a kiejtés határozza meg.
I. Elsőként régebbi megjegyzések 'újrarágva':
* A 7/a pontban említett schism az angolok túlnyomó többségénél kétszótagos ejtésű; szemben az Eton-nal, ahol az arány fordított. A grafikai kép viszont ennek pont ellentmond. (A második szótagban a schwa, ugyanaz, mint pl. az abroad szó első a-ja helyett ejtünk, az pedig vitán felül kétszótagos.) Konklúzió: itt grafikai szótagfelfogás érvényesül.
* 7/b-c. Ennek megoldásához "fonológus kellene". Ejt-e a magyar magánhangzót, pl. Krk > /körk/ ~ /krük/ (vagy zmrzlina > /zmirzlina/)? Vagy egy erős teoretikus: van-e szórag nélküli teljes nyomatékú (nem simuló) szó a magyarban? Itt döntetlen, bár az átadó nyelv szempontjából grafikai a felfogás.
* 7/d. A Staroměsto nem párhuzamos a fixen szóval: itt a két mássalhangzót két külön betű reprezentálja (m + ě = /m/ + /nye/). A magyar -- a te megoldásodnak megfelelően -- itt egyértelműen grafikai szótagolást alkalmaz (bár a fixen szóval ellentétben megtehetné az ellenkezőjét. [A Richárd semmiképpen nem ül, mert a ch egy hang.])
* Te hoztad a Mau-pas-sant példát, amely szintén grafikailag fogja fel a szótagot.
A fentiek tehát -- idegen szavak esetén -- alapvetően ellentmondanak a szótagolás szerinti elválasztás elvének, viszont elég konzekvens abban, hogy:
- a betűkapcsolatokat az átadó nyelv szabályai szerint* tekinti egységnek;
- az átadó nyelv szabályai* szerint nem ejtett magánhangzókat eldobja;
- figyelmen kívül hagyja a ki nem írt magánhangókat és az egy jel - több hang problémát;
- a fentiek alkotta szabályrendszeren belül (vagyis a betűkapcsolatokat egy-egy hipotetikus osztatlan grafémával kicsélve, nem ejtett maganhanzók törölve), a "V{n*C}V" betűsort "V-V"-vé alakítja, ha n=0; "V-CV"-vé, ha n=1; "VC-CV"-vé, ha n=2; illetve "V{n-1*C}-CV"-vé, ha n>2.
[Megjegyzések: "V" egy magánhangzót szimbolizáló graféma(!), míg "C" egy mássalhangzó-jel, "n*C" 'n' drabag egymás utáni "C".
* Az "átadó nyelv szabályai szerint" kifejezést úgy kell értelmezni, hogy ennek ellenére néha "magyaros alak" realizálódhat, vö. verne: /vern/ ~ /verne/]
Ha a fenti szabályrendszert a Nietzsche szóra alkalmazzuk akkor legvalószínűbben a Nietz-sche jön ki. A Nie-tzsche arra utalna, hogy hasonló átértelmezést végzünk, mint az ischias /iszchiasz/ > /isiász/ szóban, amelyet a jelenlegi "elvek" nem támogatnak, vö. ma már Merle /merle/ a kívánatos és nem Morse /morze/, vagyis megtartandó az átadó nyelv grafémaértelmezése.
II. Egy másik ellentmondás, amit -- eltérő "támadáspontja miatt" nem sikerült beillesztenem a fenti gondolatmenetbe. Az AkH 230. pontja két elvet rögzít:
* "Legyünk magyarosak": A forrásnyelvektől eltérő szótagolást ír elő: Ped-ro*Pe-dro helyett
* "Ne legyünk magyarosak": Egy mássalhangzónak kell tekintenünk azt a betűcsoportot, melyet magyarul hangcsoporttal ejtünk, ld. Ljubljana ejtése megfelel az írásképének, ugyanakkor Ljub-lja-na van *Ljubl-ja-na helyett.
III. Nem követendő példaként, de felhozom a szlovák szabályozást. Ott a precedencia-sorrend pontosan "fordított": (1) válasszunk el morfámahatáron; (2) ha nem megy (pl. nincs, "grafikailag fedett", nem ismerjük fel, vagy "nem akarjuk") válasszuk el szótaghatáron; de bármit is tudtál eddig a szótagról az elválasztásra alkalmazva megadjuk a "lokális" definícióját... Nem mondunk semmit az idegen szavakról -- a te felelősséged, hogy nem kötelezően felismerd a morfémahatárokat -- csak kiterjesztjük az ábécé definícióját azokkal a betűkapcsolatokkal melyek kettőshangzóként vagy osztatlan mássalhangzóként realizálódnak; van egy kiegészítő segédszabály: az ismételt (dupla) mássalhangzókat úgy tekintjük, mintha ejtésük is ismételt lenne (N.B. a szlovák nem ismeri a hosszú mássalhangzókat).
Az egyébként eltérő szótagdefinícióra legyen itt egy magyar-szlovák párhuzamos szemléltetés:
"V-V == u.a.": m. ne-on = szlk. ne-ón;
"VC-CV == u.a.": m. koc-ka = szlk. koc-ka;
"V-CV == u.a.": m. bó-ja = szlk. bó-ja;
"VC..C-CV =/= VC-C..CV": m. must-ra =/= szlk. mus-tra.
Ezt csak azért írtam le, mert úgy vélem, a kevésbé terjedelmes, részletekbe menő, de algoritmikusabb szabályozás "szebb", még annak ellenére is, hogy látszólag nagyobb terhet ró az alkalmazóra.
IV. Általános jogalkalmazói elv, hogy a jogszabály elvét kell tekinteni, annak alapján interpretálni a szöveget.
Az elválasztás lényege pedig az, hogy kellemes, olvashatóbb írásképes nyerjünk az egyenletes, nem túl nagy szóközök révén. Az elválasztáskor ugyanakkor meg kell oldani a sorváltás, sőt lapváltás problémáját; tehát nem szabad úgy "megtörni" az elválasztott szót, hogy "összarakásához" hosszú idő kellene. Így pl. a régebbi tipográfia megkövetelte, hogy egy lap végén lévő elválasztás esetén az előláb jobb szélére kiírják az elválasztott szó további részét; a következő lapon tetején hasonlóan volt "átkötés".
A Nie-tzsche elválasztás jelentősen nehezebben olvasható össze (öt mássalhangzó egymás mellett), mint a Nietz-sche (erre vonatkozott a korábbi "brrr" megnyilvánulásom), így semmi esetre sem lehet konform az elválasztás céljával: ennél már sokkal jobb, ha nem választjuk el.
Már megint sokat tanultam, de nem győztél meg. Az első hatra nem igazán tudnék mit válaszolni, hetedikhez azonban van némi hozzáfűznivalóm.
a) Ezek magyarul mindenképp elválaszthatatlanok (annyi szótag ahány magánhangzó), de tudomásom szerint angolul is (az angolok – ha jól vettem ki olvasmányaimból – nem igazán ismerik el teljes értékű szótagnak a szótagképző mássalhangzóval mint szótagmaggal alkotottakat; ha jól sejtem, ennek az az oka, hogy az önálló szótagot itt egy posztlexikális szabály alakítja ki).
b) Nem választható el, mert a magyarban (így a magyar elválasztás szempontjából) szótagot csak pontosan egy magánhangzó alkothat (a helyesírási szabályzat szerint: Meinl: –, autó: a-u-tó; ugyanígy az autóbusz-megálló emiatt kötőjeles.d) A helyes magyar elválasztás: Sta-ro-měs-to. E kérdésekben különben elég jól eligazítanak a x-re és a ch-ra vonatkozó szabályok: fi-xen, Ri-chárd.
Nem tudom, adjak-e még támpontokat, vagy szabad a gazda. Ha már játék, én inkább az előbbit választom, de ha már eleged van, szólj rám! (Kicsit önző is vagyok, mert annyi érdekes dolgot írsz ezen apróság kapcsán, hogy még akarok tovább élvezkedni.) Szóval a két további információ: 1. a kitalálandó nyelv által használt írásrendszert még nem említetted; 2. nemcsak hogy indoeurópai, hanem európai is a nyelv, amelyről szó van; 3. egyelőre nem szívesen árulnám el, hogy az indoeurópai nyelvcsalád mely ágába tartozik a keresett nyelv, mert azzal – azt hiszem – túl sokat segítenék.
Még egy pár érv a "Miért ne Nie-tzsche avagy Hol a szabály komámasszony" ;-) kérdéskörhöz:
1. "Eredeti megoldás"
2. Magyarul is malacsajt ~ malac-sajt ~ /malaččajt/
3. Német nyelvben nincsenek gemmináták /níc/ + /se/ > */níccse/ > /nícse/, de a franciában is: Maupas-sant.
4. A magyarban is elemezhetetlen tthy betűkapcsolattal írjuk a /tty/-t a Batthyány-ban, ugyanígy tzsch-vel írjuk a */ccs/-t a Nietzsche-ben. Ha az előbbire helyes (sőt, szerinted szabályos) lehet a t-thy tagolás, miért ne lehetne jó a tz-sch is?
5. Nem menekülhetünk el az idegen szavak morfémahatárainak tételes ismerete elől (a "|" a morfémahatár, a "." a hangokat választja el a magyar átírásban), pl. szlovák mucha /m.u.ch.a/ ~ viac|hlas|ý /v.ia.dz.h.l.a.sz.í/, lengyel pod|ziem|n|y /p.o.dzj.dzj.e.m.n.[jer]ü/ ~ po|dzięnk|ova|ć /p.o.dzj.en.k.o.v.a.cj/.
6. Egyébként is "kell" tudni, mi egy graféma, mi nem az, vö. Tarzan /t.a.r.z.a.n/ ~ lengyel Jerzy /j.e.zs.[jer]ü/, olasz sciugo /s.u.g.o/ ~ angol scientific /sz.aj.(ö).n.t.i.f.i.k/, angol schism /sz.[k.]i.z.(ö).m/ ~ schwa /s.w.o/ ˇmis|chief /m.i.sz/s.cs.(ö).f/, szlovák dielňa /gy.je.l.ny.a/ ~ diecéza /d.i.j.e.c.é.z.a/.
Ugyanígy kellene tudni, hogy a németben a zsch nem lehet 'egy betű', hanem /c/+/s/.
7. És végül néhány nüansz:
7/a. Az angolban a Eton ill. schism szavak vagy egyformán egyszótagosak, vagy egyformán kettő; tehát az Eton vagy elválaszthatatlan, vagy a schi-sm is helyes!
7/b. Elválasztható-e a Krkre, Krken 'Krk nevű adriai szigetre, szigeten' szó, illetve mivel különbözik ez a Pagra, Pagon 'Pag nevű adriai szigetre, szigeten' szótól, illetve a padra, padon 'ülőalkalmatosságra, -on' szótól.
7/c. Ha a fentiek szerint lehet Krk-re és Kr-ken, akkor miért ne lehetne Kr-ko-no-še (a tő ugyanaz a szó). de ha nem vesszük figyelembe a "helyi szokásokat", akkor mi akadályozza meg a hibás *Kr-a-ko-noš szótagolást.
7/d. Mit együnk a cseh Staroměsto helynévvel, melynek ejtése: /sztaromnyeszto/, Sta-ro-měs-to-t kodifikáljunk-e (grafikai egyben "eredeti" alak) vagy Sta-rom-ěs-to-t (kiejtéskövető alak)? Ha nem ez utóbbit, akkor miért Nie-tzsche?
Errata (előző hozzászólásom utolsó mondata):
"Annál is inkább, mivel a /nícse/ csak a /verne/-hez hasonló lokalizáció, és nem minden körülmények között a minimalista megoldásokhoz célszerű tartanunk magunkat."
Az egész hevenéyszer felsorolásom oda konkludált, hogy a jelenlegi elválasztási szabályok csak az idegen szavak 99%-át fedik le. Pech, hogy ebben az 1%-ban benne van a Niet-sche is, mely sokkal gyakoribb mint pl. a Kr-ko-noše, vagy a M-kr-tč-jan.
A 4. példám lényege az volt, hogy jelezzem a magyarban is vannak olyan írásképek, ahol a morfémahatárok "fedettek", de elválasztáskor "előbukkannak".
Ha már definiálni akarjuk a Nietzsche és társai elválasztását, akkor (szvsz) két populáció igényeit kell kiegészítenünk: akik "tudják, hogy eszik-e vagy isszák", és akik nem. Ez a popululáció szóról-szóra eltérhet: Nietzsche-t tudjuk, de van még Kierkegaard, Tolkien. Vagy Crichton. Vagy Myers /mejersz/ ~ Brueghel /bröjghel/. Vagy Broer /brúr/ ~ Noel /nóel/...
Konklúzió: elég, ha a magyar elválasztás szabályai úgy-ahogy lefedik a magyar nyelvet. "De több van, mit bölcselmetek felfogni képes", emiatt jobb ha egyes elemek tételesen definiálódnak. Annál is inkább, mivel a /nícse/ csak a verne/i>-hez hasonló lokalizáció, és nem minden körülmények között a minimalista megoldásokhoz célszerű tartanunk magunkat.
Egyelőre a /zs/ = /z/ + /s/-hez. Igen sok nem latinbetűs indoeurópai nyelv van, de rá kellett, hogy jöjjek, hogy nem megy! Különösen, ha a latin betűs nyelveket (amlyek a legaffinisebbek a "poligramokhoz") kizárjuk.
Részletes vizsgálat nélkül ejtem a cirill betűvel írt nyelveket is, hiszen a "zs-betű" azokban a kezdetektől jelen van. Elhagyva még a kihaltakat, az alábbiak maradtak: görög, örmény, indoiráni.
A görög nem lehet, mivel hiányzik belőle az /s/ és a /zs/ hang (idegen szavakban is pótolja, pl. Chicago > Sikago /szikagho/, ill. jour fix > zour-fix /zurfix/ 'fogadónap').
Az örményben ugyan mindhárom kérdéses hang meg van, de a zs hangnak önálló betűje van (a "J" végét húzzuk tovább egy kört csinálva kicsit a függőleges szár közepét áthúzva).
Az ind nyelvek vagy a bráhmi leányírásait (elsősorban dévanágari), vagy az arab írás lokalizációit (első sorban: perzsa-urdu) használják a latinbetűs cigányt leszámítva. Azonban ezekben az írásokban nincs "összetétel". Így az urduban dévanágari használata esetén vagy egyszerűen a /z/ hang jelét alkalmazzák rá, vagy a dzsh-betűt a z "diakritikus jelével" ellátva; perzsa-urdu írásban pedig saját jele van a /zs/-nek: egy hármaspont az r betűn. Egyébként is rendkívül ritka hang ezekben a nyelvekben a /zs/ és nem ismerek olyan ind nyelvet, amelyben meglenne mindhárom kérdéses hang.
Az iráni nyelveket vagy arab írással (pl. újperzsa-urdu), vagy cirillel (pl. tadzsik) vagy latin betűvel (pl. kurd) írják. Ezekről pedig korábban kiderült, hogy van zs betűjük. Igaz a pasto-ábécére nem találtam példát (azt sem tudom, saját írásuk van-e vagy az arab változata; de az előbbit nem tartom valószínűnek, de ha igen, akkor a saját nyelvükre kellett szabják...)
1. A h betű a különbség.
2. A kiejtésalapú elválasztás nem azt jelenti, hogy ide-oda berakok egy-egy betűt. Ha az alapszó kissebb lenne, akkor ez lenne a jó elválasztás.
3. A tartsa típusa igen zűrös, ha konzekvensen fonematikus lenne a helyesírásunk, akkor szerintem a tarccsa vagy a tarcssa volna az alapalak, és az elválasztás pedig ehhez igazodóan: tarcs-sa ~ tarcs-csa lenne. A tartsa alak tart-sa elválasztását viszont indokolja, hogy az összeolvadást itt egy nagyon későn végrehajtódó fonológiai szabály váltja ki, tehát eltekintünk tőle; továbbá fura betűkapcsolatok sor elején csak a hagyományos írásmódú szavakban idéződnek elő (a tartsa pedig éppen egy túlontúl szóelemzett alak).
4. Ez hogy jön ide?
4. Semmi bajom a kivételekkel, a magyar nyelvben és írásban is van épp elég (tőlem lehetne több vagy kevesebb is), de nem tudom, miért jó, hogy ha valami szabályból levezethető, akkor kivételként kelljen külön megtanulni.
+1. Az elválasztás kiejtésalapúságának van egy tényleges, de rendszerszerű kivétele: a rövid hangot jelölő kettőzött mássalhangzók elválasztása, pl. Mau-pas-sant.
Kedves rumci!
Egyrészt a Bottyán és a Batthyány nevek közt nem érzek igazán különbséget. Másrészt, ha már kiejtéskövetést tartod a mérvadónak (vö. 15-ös hozzászólásod), akkor miért nem kis-sebb. Harmadrészt /tarča/ ejtés mellett tart-sa írásmód van. Negyedszer Papp+val > Pappal de, Papp-pal. Negyedrészt -- ha az eddigiek nem győztek volna meg -- az eszperantóban is megtartottak egy, azaz egy kivételt.
Tudom, hogy kivételesnek tartja a szabályzat a Batthyány elválasztását, de nem az, mert megfelel a szabályoknak. Az általad javasolt ty-thy ~ thy-thy nem lehet jó, mert grafémabeszúrás csak olyan szóalakban léphet fel, mely(nek az adott része) az egyszerűsítő írásmód szerint íratik, márpedig a Batthyány hagyományos írásmódú alak.
Nekem is a (brr!) alak látszana a szabályosnak.
A /zs/ = /z/ + /s/-hez egyelőre csak súgok: nem latin betűs indoeurópai nyelv (elég kevés ilyen van).
Errata (egyszerűen képtelen vagyok leírni a Schtzschild szót, mindig "Schitzschirm-ként realizálódik":
'Igazából a Schutzschild szót kellett volna megadnom a Schutzschirm helyett. Nem azért, mintha különbség lenne köztük, de az előbbinek /šuččild/ ejtését bárki leellenőrizhetné Kirk kapitány kalandjainak soros epizódjából valamelyik német műholdas adón.'
Kedves rumci!
A Battyány-t kivételes elválasztásúnak említi az AkH 229. A szabályok alapján levezethető lenne a Baty-thyá-ny és a Bathy-thyá-ny megoldás is.
Igazából a Schutzschild szót kellett volna megadnom a Schutzschirm helyett. Nem azért, mintha különbség lenne köztük, de az előbbinek /šuččirm/ bárki leellenőrizhetné Kirk kapitány kalandjainak soros epizódjából valamelyik német műholda adón.
(N.B. Átírásod egyébklént nem volt "randa hibrid": A HTML engedte keretek közt megfelelt a Sätälä-rendszernek.)
Mindenesetre akármit gondolunk is mi, az alternatív alak a Nie-tzsche (brrr!). Nem számítva ide a kedvenc szövegszerkesztőmmel adott elválasztóprogram "kompromisszumos" megoldását: Ni-etzsc-he. ("Gyerekek, nem javaslom, hogy otthon kipróbáljátok!")
P.S. Áruld már el, kik írnak /zs/ = /z/ + /s/-t még. Nem fogok rájönni...
A Batthyány elválasztása szerintem abszolút szabályosan kiejtéskövető, így nem értem az analógiát (/baty-tyá-nyi/ = Bat-thyá-ny).
Lehet, hogy megint a németes műveltség hiánya, de és így ejteném az idézted szavakat: /níče, šulcširm, blicšlag/ (a randa hibrid átírás célja kizárólag az egyértelműség), ezért nem értem teljesen a mögöttesét még mindig. (A hit már megvan, a tudás nem. :-)) )
Szándékoltan adtam meg német nyelvű hivatkozást: nehogy nyelvi hozzá nem értéssel lehessen azt "vádolni". (Angolul egyébként hasonló, pl. itt.).
De én a Nietzsche nevet nem a Shakespeare-rel, hanem a Batthyány-val párosítanám: a mechanikus szabályalkalmazás mindkét esetben túlontúl szokatlan betűsort kapnánk a sor elején. Ezért dönthettek a morfémahatáron való elválasztás mellett, melynek felismerése (legalábbis azok körében, akik egyáltalán leírják a Nietzsche nevet) a még teljesen ki nem halt németes műveltség miatt magyar nyelvi környzetben is elképzelhető (pl. Schultz, deutsche~deutlich, Schutzschirm, Blitzschlag).
Egyébként szégyellem magam: eddig még nem találtam olyan nyelvet, melyben a /zs/ írása rendszerszerűen = /z/ + /s/.
Magam sem úgy értelmeztem, hogy a szakszövegekben másként kellene elválasztani; ha erre a következtetésre lehetett jutni a hozzászólásomból, akkor amögött leginkább fogamzászavar lehet.
A 237. ugyanakkor egyértelműen önálló szavakról beszél. Abban is egyet értünk, hogy bizonyos "prefixek" megértettek arra, hogy de facto szavakká nyilvánítsuk őket, így pl. phls listájából mikro-, foto-, mikro-, elektro-, kis jóakarattal még a tele- is (teleház).
Vegyük ugyanakkor a sztenográfia-t, vagy a topográfia. Sem a szteno-, sem a topo- prefix nem tekinthető szószerűnek, de a -gráfia tag sem; legalábbis nem jobban mint a -gram (a = -gráfia rögzített eredménye) elem, melyet rendszerszerűen a szótaghatáron választatnak el. (Ez utóbbitól eltér a -gramm 'súlymérték' szó.)
Igen érdekes a telegram. Ennek ajánlott elválasztása te-leg-ram, tehát a tele- "mégsem szószerű". Ugyanakkor megengedett a te-le-szkóp, melyben a -szkóp-ot nehéz önállósult lexikai egységként felfogni, tehát mégis a tele-nek kell annak lennie.
Az inter(-)aktív és mikro(-)szféra elválasztatlanságát pedig csak véletlennek lehet elkönyvelni, minthogy utótaguk törzskönyvezett magyar szó. Ide venném még az elektro(-)szkóp-ot és a elektro(-)sztatikus-t is (vö. elektromérnök).
A fentiek arról tanúskodnak, hogy a kodifikátorok nyelvérzéke sem egységes abban, hogy melyek az önálló magyar elemek. Ennek hiányában pedig a plebsz számára is a "nyelvérzék" marad mint támpont.
Lehet, hogy erős értelmiségi mentalitásom és biológusdiplomám okozza, de én a fil+antróp mindkét elemét szószerűnek érzem (de különösen az utótagot): egyik oldalról mizantróp, antropomorf, antropológia, ...; a másikról fílosz, filológia, hungarofil, bazofil, audiofil, ... Nem látom tehát magyar nyelvűek számára meghatározóan nehezebben felismerhető "összetételnek" a filantróp-ot, mint teleszkóp-ot vagy sztenográfia-t.
Erkölcsösebbnek tartanám tehát az elemek szerinti szétválasztás lehetőségét kodifikálni még a re-klám, Shake-speare stb. esetben is.
(N.B. Az utóbbinak van egy "praktikus" oka is: ha pl. ezt a nevet angol nyelvű szónak nyilvánítom, akkor a nem-mondom-ki nevű szövegszerkesztő elválasztása nem minősülne hibásnak. Ez blőd dolognak tűnhet, de többek közt hasonló oka volt a legutóbbi német helyesírási reform azon változtatásának, hogy a ck vetűkapcsolatot azentúl nem k-k-ként kell elválasztani.)
Való igaz, hogy elég értelmetlen volt egy szabálypontot szétszedni két egymástól távolabb esőre, de szerintem a két szabálypont nem igazán mond ellent egymásnak, inkább kiegészíti egymást. (A szaknyelvi szövegekben, összetételi határon való elválasztás lehetősége csupán a problémás szavak egy töredékére vonatkozik. A 231. ráadásul nem azt mondja, hogy szakszövegben másként válasszunk el, hanem azt, hogy az összetételi tagok szerinti elválasztásnak „kivált szaktudományi munkákban” létjogosultsága. Szerintem a 231. második bekezdése és a 237. második bekezdése ugyanazt a halmazt akarja definiálni, csak ellenekző irányból.) A termo/termó szinte önálló szó a magyarban, ha nem is teljesen az, nagyon traszparens összetételi tag (vö. termotasak, az akció pedig teljesen az. A filantróp egyik eleme sem tiszta a csak magyarul tudó számára, így annak „összetételi tagok” szerinti elválasztás, szerintem mindenképp hiba.
Sajnos, nem tudok németül, így bármennyire is sajnálom, nem értem a hivatkoztad szöveget. A hozzászólásodból legalább kiderült számomra, hogy németül helyes a Nietz-sche elválasztás, németül nagyon jól tudó ismerőseim ugyanis arra a kérdésemre, hogy hogy kell e szót németül helyesen elválasztani, nem tudtak felelni. Mindez azonban nem befolyásolja azt, hogy ez az elválasztás (noha esztétikusabb sorkezdetet eredményez) a magyar elválasztási szabályoknak ellentmond. Márpedig idegen neveket magyar szövegben a magyar szabályok szerint kell elválasztani, vö. Shakes-peare. (Sajnálom, hogy a Nietzsche szó kétmorfémás, pedig úgy örültem, hogy a /cs/ hangot a németben is jelölték c + s kombinációjával. Apropó: rejtvény következik. Tudja-e valaki, hogy melyik az a [tudomásom szerint] egyetlen nyelv a magyaron kívül, amely a /zs/ hangot a /z/ hang jelének és az /s/ hang jelének kombinációjával jelöli?)
A Nietz-sche elválasztás megfelel az ajánlott anyanyelvi szabálynak (vö. pl. itt), ugyanis két elemből áll (a Nietz főnév + -(i)sch(e) melléknévképző), így a cs ejtés csak hasonulás.
Az AkH 231. "magyarban nem önálló létű elem"-ekből álló szavakat nem tekint összetételnek, és itt is megengedi mindenki számára az eredeti összetételi határon való elválasztást (annak ellenére, hogy nem összett szó), már aki felismeri (csak ezt kihangsúlyozza a szaktudományi munkákra való hivatozás).
Az AkH 237. valóban nincs teljesen szinkronban a fentiekkel. Viszont itt ad egy definíciót a 231-ban meghatározatlan "önálló lét" fogalomra: ez az, hogy az egyik elem önálló magyar szó legyen.
(N.B. A 237. nem összetett szavakról, hanem "az alakulat összett voltáról" beszél; ugyanakkor a 231. is elemeket, elő- és utótagokat említ, miután kijelenti, hogy nem összettek. Ez inkább terminológiai zavar, mint ellenmondás: az "összetétel" köznyelvi jelentése keveredik a szaknyelvi tartalommal.)
Az ellentmondás ott van, hogy a 237. szigorúbb feltételt ad meg, mint az 231.; így ez utóbbi példái sem férnek az előbbi által adott definícióba: sem a termo, sem a sztát nem önálló magyar szó, ennek ellenére lehetne termo-sztát.
A fentiek fényében a citált lista még ellentmondásosabb. Én úgy érzem, hogy több személy többféleként vélekedett az "önállóság"-ról, esetleg több lektorral súlyosbítva...
Mindenesetre a tranz-akció mindenképp megengedettnek tűnik. De több éves klasszikus tanulmányaimat sem fogom amnéziára ítélni, ha a filantróp-ot kell elválasztani. De azért nálam is vannak kivételek: általában Viseg-rád-ot írok és nem Vise-grád-ot...
Számomra a szabály is, a példák is azt mondják, hogy ha a két potenciális összetételi tag közül legalább az egyik létezik (az adott szóba illő jelentésben) a magyar nyelvben (kvázi-) önálló szóként. Ez a mo-nog-ram : mo-no-grá-fia ~ mo-nog-rá-fia : bib-li-og-rá-fia oppozíciókon kívül mindenre magyarázatot ad (bár ebből is sejtet valamit). Csak azt tudnám, hogy a Nietz-sche elválasztásnak mi az oka!
Egy kissé OFF leszek, merthogy itt már többrôl van szó, mint egyéni nyelvérzékrôl. Viszont nagyon is kapcsolódik a téma a tranzakcióhoz.
Az idegen elemet is tartalmazó szavak elválasztásáról az AkH. 231. és 237. pontja szól. Az elsô, közös bajom velük, hogy nem hivatkoznak egymásra, pedig ez nagyon is elkelne. A 231. lényegében azt mondja ki, hogy a két idegen szóelemet tartalmazó magyar szó ált. NEM számít összetételnek, legfeljebb szakmai műben: tipog-ráfia, ?tipo-gráfia. A 237. arról szól, hogy egy idegen tag és egy magyar szó együttese ált. összetétel, de ha az átlagos nyelvérzék – itt a jelen rovat kulcsszava! – nem érzi annak, az sem baj. Tehát: para-frázis v. paraf-rázis (ráz-is-ki-tôle-engem-a-hideg).
Most az AkH.-ból s az ôt követô Magyar helyesírási szótárból (MHSz.) idézek (oly értelemben, hogy az ajánlott elválasztást írom ide; ennek hiánya is fontos infó):
A magyar edz szó a vitatott eredetűek közé tartozik. Az egyetlen, de kissé bicegős etimológia a más kihalt ügy = 'víz' szóból eredezteti.
Jelentéstanilag erre az ad alapot, hogy eredetileg csak fémet lehetett edzeni, melynek szokásos módszere volt a többszöri felhevítés majd gyos lehűtés vízbe mártással.
Fonetikailag az ü ~ e változás kimutatható a homofón ügy = 'szent' szó egyház származékán.
Maga a dz természetesen kifejlődhetett két egymást folyamat összhatásaként. Egyrészt egy kötőhangző nélkül kapcsolt z képzővel való hasonulás eredményeként (vö. vizez), másrészt az egy időben "szokásos" hangzóközi z(z) > dz hangváltozás eredményeként (vö. mazzag > madzag, fogózik ~ fogódzik).
A szóvégi dz "szokatlansága" feloldható azzal, hogy a hang eredetileg a ragozott alakokban fejlődött ki (pl. "edzi a vasat"), majd analógiával terjedt a nullaragos alakra. Hasonló folyamatok alakíthatták ki a hangfestőként "meghatátozott" pedz szavunkat.
A szabálytalanság iránti igényedet pedig azzal "hárítanám el", hogy a dz egy hang a c zöngés párja, pusztán az a pechje, hogy nem alkottunk neki önálló betűt. (Pedig megtehettük volna: vannak ortográfiák, ahol a cirill "z"-hez betűvel adják vissza. Ugyanakkor a c-t is írtahnánk tsz-ként.) Ezért az eddze szóban nem a z hosszú, hanem maga a dz hang.
A helyesírásunk inkább ott következetlen, hogy a dz ejtése mindig hosszú, de ennek ellenére rövid hangzóként kell írni a hasonulásos alakokat kivéve, pedig ott sem ejtjük hosszabban.