Megnéztem a verset, sokat tanultam belőle :-)
Ha jól értem, a fejrészbe azt kell írni, hogy META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8", ezek után minden unicode-os karakter szerepelhet a szövegben, mint:
&-szekvencia, pl ó ó
&#nnn;-kód, pl ő ő
UTF-8 kód, erről azt kell tudni, hogy minden 127 fölötti karaketerhez kétbájtos kód tartozik; éppen emiatt 'normális' ékezetes betűk _nem_ lehetnek a szövegben.
Az ékezetes betűk látszanak, de a többi nem ;) Na jó, szóval a spéci jelek. Egyébként miért letapogatós betűkkel írtad? Így nem fér a helyére a lábjegyzet, és hála neked, nem lehet se átméretezni, se elgörgetni azt a keretet. Na vége az offnak, szóval ha jól vettem ki, akkor az alsó idézőjel meg a gondolatjel egyáltalán nem jön át ('?'), míg az aposztrófok után a versben akkora szünetek vannak, hogy oda beférne egy-egy rövidebb könyv a Bibliából...
Örülök, hogy segíthettem ;)
Azt javaslom, a Bugyor rovatból az Elátkozott kitaszított című paródia elejét nézd meg! Az álfrancia versben mindenféle nyugati ékezetek, a szövegben pedig -- szerintem -- helyes kettős hosszúékezetes ő-k és űk láthatók. Remélem. Ha mégsem így lenne, kérem, hogy rikoltson az illető, és árulja el, miféle operációs rendszert illetve böngészőt használ. Köszönet!
OK. Ezt most linux+lynx-ből írom, szerintem amit az előbb írtam, az itt is igaz.
Gyors ellenőrzés: árvíztűrő tükörfúrógép - ÁRVÍZTŰRŐ TÜKÖRFÚRÓGÉP
Ha ez jól olvasható, akkor itt sincs szükség &-szekvenciákra.
Az unicode egy újabb szenvedési lehetőség, még nem kellett szembenéznem vele, ha jól látom a nekünk fontos betűk kódja 0x150,0x151,0x170,0x171 = 336,337,368,369
Kontra utolsó oszlop. Beírom, és nézd meg Latin 2-vel kódolva:
õ (õ) - ő
û (û) - ű
Ha még mindig nem magyarnak látod, akkor gyere el Szegedre, és megmutatom, hogy Unix rendszer alatt (ahol _nincs_ ilyen alt-os barmolás) hogy látszik. A W9x meg az állítólagos unicode-jával mehet a sóhivatalba. (nem tudtam rávenni pl az Office 97-et, hogy a unicode-os times new roman ne kockákat írjon eme 2 betű helyére. Nem baj, használok garamondot ;) )
Kalapost jelent, de nálam minden 8859-2-es fontban magyar ű-nek néz ki. Amit írtál, azt tudom, hogy a fejlécbe kell, nem is vitattam, de van, aki falra mászik, ha felülbírálják a default beállítását. Pláne ha ez a kérdőjeleket hozza magával.
A szekiktől a HTML olvashatóbb lesz, de kevésbé hordozható. Pl. közép-európai kiosztásból is kettő van: az ISO meg a Windows (mert miért is lenne jó BG-nek, ami másnak az...)
Az û minden kódrendszerben kalapos u-t (u^) jelent, legfeljebb nem lehet megjeleníteni, és egy kérdőjel lesz a helyén.
Mint írtam, a megoldás _két_ lépésből áll: egyrészt a fejrészbe kell betenni amit írtam, másrészt az ilyen &***; szekvenciák _helyett_ normális karaktereket tegyünk a szövegbe (más kérdés, hogy ettől a HTML file kisebb és olvashatóbb lesz - ezt el kell viselned)
Ettől már csak az mászik a falra, akinek bőven jó a 8859-1 (mert esetleg olyan kódolással vannak magyar karakterei (érdekes, mi?)), és nála csupa kérdőjel lesz az illetékes (összes ékezetes?) betűk helyén, mert nincs neki ilyen kódkiosztott készlete. Szerintem tényleg mindenki írja azt, ami jónak látszik, akinek meg nincs, az hullámos ő-t (&otlide;) ill. kalapos ű-t (û) használjon -- a 8859-2-nél ugyanis pontosan ebből lesz szép magyar bötű.
Szép zagyva mondatok, eh.
Na, Teve, ezt jól megcsináltad... most a te bénaságod miatt jó lett az oldal...
szóval ezt kell a fejrészbe:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-2">
A kalapos nem, csak a hullámos. Az van ui. a kódlapon az illetékes helyen. Egyébként ha azt mondod nekik, hogy Latin 2 (ISO-8859-2)? Ez nem hangzik éppen M$-nek...
Kedves Surranó!
Javasoltam ám nekik, de azt hiszik, hogy az afféle M$ huncuftság. És elegánsabb is a kalapos ő, mert rögtön látszik, hogy progranyozó csinálta.
Kis Ádám
"semmiképp nem tudnak Ő-t és Ű-t írni. " Hát, ez nálam hullámos/kalapos bötű lett, de vsz mindenkinél, ahol nincs közép-európai kódlap. Annak és a unicode-nak a kiosztását meg szerezzék meg valahonnan...
Kedves BIJ, örülnék, ha egy kicsit többet írnál erről, mert a webmester-ismerőseim azt állítják, hogy semmiképp nem tudnak Ő-t és Ű-t írni.
(Egyébként igazad van, hogy hiányos volt a kijelentés, de alapvetően szövegszerkesztőkre gondoltam).
Kis Ádám
>> A UNICODE tartalmazza az összes magyar karaktert, igaz,
>>egyelőre csak a Microsoft támogatja.
Meg például a JAVA programozási nyelv-környezet (a SUN-tól).
Kedves Arghonaut2!
Meglehetősen nagy számú betűkészlet van a közép-európai kódlapon, amelyek valamennyi magyar ékezetes betűt ismerik. Ezek pl. a Wordben CE mellékjelet kapnak. Gyári termékek. Emellett tudomásom szerint profik is foglalkoznak betűgyártással.
Igazad van abban, hogy betűt ne gyártson Fontographerhez szabadult amatőr, de megkockáztatnám, hogy esetleg könyvet (plakátot, weblapot) se készítsen Word, PageMaker, Netscape elé szabadult amatőr. Mert nemcsak egy rosszul vésett betű kritizálható, hanem egy fél hüvelykes beütés, egy páros oldalon kezdődő fejezet, vagy egy nem aranymetszésben feltett címdoboz is. Nekem az a bajom, hogy ugyanazok nyugszanak bele a rossz betűk használatába, akik a felsorolt hibákat is elkövetik.
Kis Ádám
Kedves Kis Ádám!
Nos, az igaz, hogy az _UNICODE_ tartalmazza a magyar karaktereket, de a gyakorlatban ez úgy néz ki, hogy a nem UNICODE-os TrueType betűtípus nem, vagy nem a megfelelő kiosztásban.
Mondjuk a bittérkép dolog az a vektoros betűknél nem így megy, de az most mindegy is. Teljesen igaz, hogy a betű megújítható - ahogy a dúcokat vésték, csak az a lényeg, hogy azt is _hozzáértők_ csinálták (csinálják), és nem csupán egy Fontographer elé szabadult amatőr - már elnézést a kifejezésért.
Tehát csak magyarítsanak. Azok, akiknek van szemük a betűhöz.
Kedves Moga!
A TEX és a magyarsághoz még egy adalék: az ékezetes betűk alkalmazásának illusztrálására Knuth egy helyen Pólya György nevét használta.
A másik: A nyelvészek időnként naív áhítattal fogadnak el mindent az informatikustól. Kiváló nyelvészprofesszorunk is felvetette, hogy le kellene mondani az ő-ről és az ű-ről, hogy igazodjunk a számítógép lehetőségeihez. Alig tudtuk lebeszélni róla.
Kis Ádám
Kedves Arghonaut!
Kijavítani nem tudlak, mert nem egészen világos a számomra, amit mondasz. A UNICODE tartalmazza az összes magyar karaktert, igaz, egyelőre csak a Microsoft támogatja. Ezen kívül számos TrueType font is "tud" magyarul.
Ami az ékezetesítést illeti, tudomásom szerint vannak olyan eszközök (phontographer), melyek segítségével új betűk rajzolhatók, illetve a régiek megváltoztathatók, méghozzá a bittérkép módosításával. Ez olyan, mint amikor a hagyományos nyomdában új dúcot véstek. Miért tiszteletlen és a külcsínt rontó megoldás ez?
Kis Ádám
Kedves Tova Szilárd!
Nem teljesen érthető a megjegyzésed. A Word97 viszonylag jól rendez már most is, problémát a vaszár-típusú összetételek jelenthetnek, de ez gépileg megoldható. A szótár minden természetes nyelvi feldolgozásnak elengedhetetlen eszyköze, nemcsak nálunk, hanem odaát is.
Milyen változtatást kellene, hogy hozzon az EU-csatlakozása a szabályzatban? Igazán érdekelne, mire gondolsz.
Kis Ádám
Kicsit offtopic leszek.
Knuth mester azért alkotta a TEX-et mert, felháborodott rajta, hogy hány sujtóhuba sikeredett a Programozás művészete c. könyvébe.
És mivel ez a könyv erősen elméleti (sok matematikával), és hál' istennek, sok ismert magyar matematikus van, akiknek a nevében hosszú magánhangzó van, ezér gyorsan felvette a \H -t.
És egy másik történet. Valamikor nagy tételben rendelt a volt cégem, egy angol sw. cégtől egy progit. A program saját karakterkészlettel dolgozott. Természetesen nem volt benne ékezetes magyar magánhangzó. Arra hivatkoztak, hogy az akkori (5-6 évvel ezelőtt) internetes magyar kiadványokban sincs ékezet. Ahhoz hogy meggyőzzük őket, le kellet tenni eléjük 2 újságot, az akadémiai kiadó helyesirási szótárát, és egy általunk összeállított szópárokat tartlamazó listát ugyanazok a szavak, ékezettel és ékezet nélkül, magyarul angolul. ( azt hiszem, ez győzte meg őket. illetve a szár-szar páros.)
Nos, ha Internetes karakterkészletet használnak valahol (értsd: kenyérszövegben), akkor nem lehet magyarítani, csak ha az adott magyar fontot letölthetővé teszik. Másrészt a betűk nem "ékezetesíthetők" egyszerűn. Tipográfiai szempontból nézve: aki ezt "csak úgy" teszi, annak 0 érzéke van az esztétikum és a tipográfia tiszteletéhez. (Más kérdés persze, hogy aki ezt teszi, annak valószínűleg kevés érzéke van amúgy a külcsínhez is.;))
(Javítson ki nyugodtan, ha valaki többet tud ezekről.)
Kíváncsi vagyok, vajon várható-e valami változás az igencsak bonyolult ábécé-sorrend meghatározásában. Hiszen a jelenlegi szabályokat csak szótár és szemantikus elemzés birtokában lehet megvalósítani. Vajon elvárható-e, hogy minden olyan nem-magyar intézmény, ahol magyar szövegek születnek -- legyen az akár csak egy városnév-lista is --, rendelkezzen a szükséges eszközökkel?
Az EU-csatlakozás szerintetek hoz-e valami módosítást a szabályzatban?