Keresés

Részletes keresés

BZoltan Creative Commons License 2004.09.03 0 0 94
"És kissé röhejels, amikor az információtechnológiai fejlesztők közé sorolod magad."

Lehet, hogy számodra röhelyes... de nekem viszont ez a szakmám, ezt csinálom, ebből élek és nem tegnap óta.

"Te úgy képzeled, hogy a te megegyezésed egy harmadik személlyel, vagy akár egy olyan csoport, mint egy szoftvergyártó megegyezése egy olyan csoporttal, mint a felhasználóik, az közmegegyezés?"

a közmegegyezések alulról szoktak indulni és ködös elképzeléseddel ellentétben nem a duna jegén közfelkiáltással hanem igenis kisebb szakmai körökben indult el a kalapos ö használata.

"Az bizony magánmegegyezés, amelyhez sem nekem, sem a nyelv egészének nincs köze."

egy az eszközök korlátai miatt szakmai körökben elterjed megoldás a szakterület robanásszerű elterjedése miatt szeéles körben elfogadott dolog lett.
Ehez neked annyi közöd van amennyit csakakarsz.. a nyelv egésze meg mint olyan... nem létezik? Vagy szerinted létezik nyelv emberek nélkül akik értenék, beszélnék?

"süt belőled a gyűlölet a bölcsészek iránt."

Hahahaha :) Na mivan eltaláltam, hogy bücsész vagy? Hahaha :D :D dehogy gyűlölöm, a bölcsészeket, bagyon is szeretem őket.. tele vagyok bölcsész barátokkal.. tény, hogy az értelmesebje nem akar belepofázni triviálisan informatikai dologba, ugyanis ahoz nem értenek... Büccsész onnantól lesz valaki, hogy a lenonszemüveg és a szőrtarisznya meg a kordnaci viselésben kimerül a szakmaisága :)

"mert én nem figyelek tovább rád."

Ezt úgy mondod, mintha eddig odafigyeltél volna :) Amúgy nyilván elolvasod ezta hozzászólásomat, különben minek írtad volna a sajétodat.

Na pá :)
Előzmény: Kis Ádám (93)
Kis Ádám Creative Commons License 2004.09.02 0 0 93

Tulajdonképpen felesleges erre válaszolni. Főképp azért, mert nem velem vitatkozol, hanem isten tudja kivel. Heleynként teljesen indokolatlanul irogatsz dolgokat. És kissé röhejels, amikor az információtechnológiai fejlesztők közé sorolod magad.

 

Két konkrétum:

1. ki is írt felfedezésekről? Én miondig a fejlesztés szót használtam.

2. Te úgy képzeled, hogy a te megegyezésed egy harmadik személlyel, vagy akár egy olyan csoport, mint egy szoftvergyártó megegyezése egy olyan csoporttal, mint a felhasználóik, az közmegegyezés? Az bizony magánmegegyezés, amelyhez sem nekem, sem a nyelv egészének nincs köze.

 

 

Emellett süt belőled a gyűlölet a bölcsészek iránt. Ez megint a tudatlanságodat mutatja.

 

Most pedig jelzem, hogy további válasszal ne fáraszd magad, mert én nem figyelek tovább rád.

 

Kis Ádám

Előzmény: BZoltan (92)
BZoltan Creative Commons License 2004.09.02 0 0 92
"az általad sokat emlegetett közmegegyezés nem úgy működik."

:) kezdem magam mókásan érezni :) Szóval _TE_ meg akarsz engem győzni, hogy a köztem és egy harmadik személy közötti megegyezés nem úgy működik ahogy én azt gondolom :) Barátom, te el vagy tájolva :)

Megnyugtatlak, hogy amikor a 256 féle ascii kód volt még csak használatban, akkor bezony közmegegyezés volt a kalapos ékezetek használata...akár tetszik ez neked akár nem. Az ember először rájött, hogy bakker, nincs ű sem pedig ő, aztán megnézte a táblázatot és aszonta, hogy na akkor legyen ő az a kalapos és azt használta, aki meg olvasta az meg megértette... ezt hívják közmegegyezésnek :)

"Mások viszont úgy gondolták, hogy ez csak egy ideiglenes állapot, és kifejlesztették a közmegegyezésnek megfelelő számítástechnikai eszközt."


Kapitális tévedésben élsz majsztró :) azok akik kifejlesztették az univerzális kódtáblázatokat azok soha nem gondoltak semmit ideiglenesnek vagy véglegesnek.. azok egy nemzetköziesítési projectet fejlesztettek ami többek között megoldotta egy olyan problémát amit addig a felhasználók máshogy oldottak meg. De tévhiteddel ellentétben a felhasználók sosem voltak ideiglenesen állapotot tartó roppant bölcsekre és naívan véglegesnek gondoló butákra :)

Amíg nem volt univerzális rendszer addig használtuk azt ami volt.. ha nem lett volna kalapos ő akkor kitaláltunk volna valami mást :) de valahogy jelöltük volna azt a fránya bötüt.. még akkor is ha a kedves büccsészmérnök nyelvésztársadalom a haját tépi is ki nyelvgyalázést rikácsolva :)

"Ha kielégítőek lennének a helyettesítő megoldások, nem költöttek volna egy halom pénzt pl. a UNICODE kifejlesztésére."

Az információtechnológiai iparágban _FEJLESZTÉSEK_ vannak és nem feltatlálások és felfedezések... vannak problémák és azokat egyre jobban és jobban oldjuk meg... a kalapos ő is kiválló megoldás volt az ascii keretein belül, de tény, hogy az unicode az még jobb.. naná, hogy fejlődik a számtech.

z
Előzmény: Kis Ádám (90)
Kis Ádám Creative Commons License 2004.09.02 0 0 91

Nagyon érdekes, amit írsz, abban a tekintetben, hogy még tovább növeli bennem a tisztelet a nyelvújítók tevékenysége irányában. Én azt hittem, hogy zömében csak válogattak a lehetőségek közül, de ezek szerint voltak eredeti újításaik is. Persze, a szókincs terén sok ilyen volt, de ott az eredmény nagyon szóródott.

 

Kis Ádám

Előzmény: rumci (89)
Kis Ádám Creative Commons License 2004.09.02 0 0 90

Írod:

 

"A nyelv egy eszköz amit érdemes jól, változatosan, helyesen és biztonságosan használni. "

 

Használni úgy hjasználod, ahogy akarod, magánügy. De mergváltoztatni nem tudod. Nem azért, mert valaki megtiltja, hanem azért, mert az az általad sokat emlegetett közmegegyezés nem úgy működik. Te például úgy érezted, hogy közmegegyezés alapján helyettesíted a kétvesszős ékezetet. Mások viszont úgy gondolták, hogy ez csak egy ideiglenes állapot, és kifejlesztették a közmegegyezésnek megfelelő számítástechnikai eszközt. Merthát a számítógép és a szoftver is csak egy eszköz, amelyet érdemes jól, a felhasználóközeg kultúrájához alkalmazkodva használni.

Ezt te nem tartod fontosnak (bár lehet, hogy ezt szóban tagadod, de ahogy a nyelv jelentőségét bagatellizáod, az egyértelműern bizonyítja), de azok, akik a pénzt adják a fejlesztéshez, nem tartják annak, azért tartották fontosnak az alkalmazói programok lokalizációjára sok pénzt költeni. Ha kielégítőek lennének a helyettesítő megoldások, nem költöttek volna egy halom pénzt pl. a UNICODE kifejlesztésére.

 

Amit a posztromantikus pátoszról írsz, annak csak csak lélektani hozadéka van.

 

Kis Ádám

 

Előzmény: BZoltan (88)
rumci Creative Commons License 2004.09.02 0 0 89
Helyesírás-történetekben, cikkekben sem találtam meg az ő, ű első előfordulásainak tartott adatokat, úgy néz ki viszont, hogy egészen az 1832-es szabályzatig erőteljes kisebbségben volt. Biztos adatok ugyanakkor az 1790-es évektől vannak. A nagyszótári korpuszban van egy-két kóbor adat korábbról, de annyira csekély a számuk, hogy akár rögzítési hiba is lehet, illetve olyan adatok, amelyek tulajdonképpen ö,ü betűk, csak kicsit elmosódott a mellékjel (elvégre amíg nem volt oppozíció, nyilván nagyobb volt a betűk hibatűrése, ráadásul a régi nyomtatványok ékezetei elég egyenetlenek voltak), ugyanis ezek az adatok igen gyakran feltehetőleg rövid magánhangzót jelöltek. Mivel tulajdonképpen a hosszú ő, ű hangnak a jelölése maga is a 18. századig nyúlik vissza (egy-két kósza kísérlettől eltekintve). Szathmári (1968) szerint Pereszlényi Pál (1682) azt írja, kézírásban használatos az ő, ű betű. Az idézet alapján („Eſt etiam uſus in manuſcriptis duarum virgularum ſupra o et u, quae ſupplent vices ſuperponendi e parvuli in Diphtongis.” [NB. akkoriban az ö, ü hangokat diftongusnak nevezték, ennek tárgyalása azonban nem tartozik jelen kérdésünkhöz]) az az érzésem, Szathmári félreérti a forrását. Arról lehetett szó ugyanis, hogy a (rövid és hosszú ö, ü esetében egyaránt használatos) kis e betűről szólt Pereszlényi. A kódexekben látható, hogy a régi írásbeliségben az e-t két egymás mellett levő vesszőcskeféleség jelölte, így hát az o, u-ra tett kis e-ből először valószínűleg két vessző lett, majd ez rövidült kézírásban ponttá, s ez utóbbit már érdemes volt a nyomtatványoknak is türközniük. Ehhez képest az ő, ű jelének ékezetei másodlagos, immáron funkcionális megnyúlásnak tekintendők.
Érdekes, hogy szinte az összes magyar betű első előfordulását feltárták, de az ő, ű-vel kapcsolatban ilyenről nem tudok. Erősen valószínűsíthető, hogy a 18. század második felénél korábban egyáltalán nem fordult ilyen elő. Miként az is, hogy ez a változás nem a kézírás igényére alakulni ki, hanem a nyomtatáséra: a kézírásban, pláne a valódi tollal való írásban semmi gondot nem jelentett pont-pont-vesszőcskét rajzolni, míg a nyomdában ez a speciális, igen magas ékezet gyakran letört, így megkínlódtak vele. Egyébként a pont-pont-vesszőcske mellett és előtt vannak adatok e + vesszőcskére, illetve pont + vessző, valamint vessző + pont megoldásra is.
Előzmény: Kis Ádám (87)
BZoltan Creative Commons License 2004.09.01 0 0 88
"A nyelvvel kapcsolatos véleményedet nem szeretem, és nagy tévedésnek tartom."

nem szeretni jogod vana véleményemet.. az hogy tévedésnek tartod, meg kifejthetnéd. Szerintem gyerekes szentimentalizmus túldimenzionálni a nyelv misztikumát. A nyelv egy eszköz amit érdemes jól, változatosan, helyesen és biztonságosan használni.
Én sajnos 3 nyelven élek 24/7 módban... egy nyelv otthon egy a munkahelyen egy meg az anyanyelvem... sajnos nem hiszek a posztromantikus pátoszban ami a nyelvet mint kommunikéciós eszközt körüllengi.

z
Előzmény: Kis Ádám (86)
Kis Ádám Creative Commons License 2004.09.01 0 0 87

Nem biztos, hogy a véglegesülés időpontját kellene nézni, hanem a tendencia kialakulásának kezdetét. Az meg már üti valahol a 300-at. Egyébként lehet, hogy a pont-pont-vesszőcskés a logikusabb, de a három ékezet már túlzás.

Kis Ádám

Előzmény: rumci (82)
Kis Ádám Creative Commons License 2004.09.01 0 0 86

A dolgok jelentős részében valóban nincs vitánk. A nyelvvel kapcsolatos véleményedet nem szeretem, és nagy tévedésnek tartom. A számítógép és a nyelv viszonyát illetően viszont nem hiszem, hogy rád szorulnék.

Kis Ádám

Előzmény: BZoltan (79)
BZoltan Creative Commons License 2004.09.01 0 0 85
jelenleg az hogy valami elegendően univerzális az már frankó
Előzmény: rumci (81)
rumci Creative Commons License 2004.09.01 0 0 84
Persze, hogy beleférne. De pillanatnyilag nincsenek kiosztva a szanszkrit ligatúrák semmilyen tartományban. Gondolom, ezt pótolják majd idővel. Mint ahogy a magyar nyelvjárási és régi betűk jelentős részét sosem, ezért jó gondolat a Private Use Area.
Előzmény: Kis Ádám (78)
rumci Creative Commons License 2004.09.01 0 0 83
Sajnos, nem. Egy hónappal ezelőtt keresgéltem, és sehol nincs nyoma a kódtáblákban. Egyetlen megoldás a repülőékezetesre emlékeztető összerakós megoldás, de azzal elég kellemetlen kompatibilitási problémáim voltak a közelmúltban.
Előzmény: Kis Ádám (77)
rumci Creative Commons License 2004.09.01 0 0 82
Az ő és ű alakja 1832-ben véglegesült, úgyhogy a 3-400 év túlzás. Korábban a pont-pont-vesszőcskés és a két vesszős alak ingadozott (régebben egyértelműen az első javára).
Előzmény: Kis Ádám (75)
rumci Creative Commons License 2004.09.01 0 0 81
Márpedig semmi nem univerzális. De ezt a Unicode szépen megoldja a Private Use Areákkal.
Előzmény: BZoltan (74)
rumci Creative Commons License 2004.09.01 0 0 80
Csakhogy a dévanágari írás ma is használatos, míg ezt a hieroglifákról nem lehet elmondani.
Előzmény: BZoltan (73)
BZoltan Creative Commons License 2004.09.01 0 0 79
"Ha eddig nem volt érthető..."

Mint már említettem, nyitott ajtókat döngetsz.. számomra a dolog a lehető legnagyobb mértékben világos és érthető. _NEM_ engem kell itt és erről meggyőzni :)

"az nem, hogy vietnámi szöveg írásához is ez a célszerű."

teszteltem a saját utf-8 alapon pergő rendszeremet vietnámi anyaggal és nem volt problémám... ennél jobban nem foglalkoztatott a dolog.

"Mindig voltak, akik azt igényelték, hogy a magyar nyelv alkalmazkodjék a számítógéphez,"

Most mondok egy csúnyát... nem érdekel a magyar nyelv, ahogy sosem érdekelt és eztán sem fog. Egyetlen nyelvet sem tartok többre mint egy emberi kommunikációs típus kódolási rendszerénél.
Az és csakis az érdekel, hogy a kommunikéló felek adatkódolási hiba miatt félreértés és kommunikéciós lassúság miatt ne szopjanak.
Tehát baromira nem érdekel sem a kalapos, sem a hullámos, sem a duplavesszős ö sem az ü. Ha a köznmegegyezés szerint a duplabalrakacsacsőr az ő akkor nekem az lesz az. A többi szerintem a gittrágás és a fingfűrészelés kategórájába tartozik és mint ilyent meghagyom a bölcsészeknek.. írjanak belőle ezernyi PhD dolgozatot :)

"elég komoly nyomást gyakoroltak bizonyos nyelvészkörökre, hogy a nyelvi norma fogadja el ezt a kompromisszumot."

Azt meg ne gondod, hogy a nyelv és az informatika között bármikor is bármilyen ellentét volt és naívság azt gondolni, hogy a nyelvészek meg nyelvédők keménytöküsége védte meg a hamvas nyelvünket.
A nemzetköziesítési szándék már régóta megvolt az informatikában... a gáz az, hogy sokan még a mai napig is a 80-as évek világában élnek. A számítástechnika soha nem akarta a nyelvet magához igazítani...az ostoba lámer júzerek nem voltak képesek (sokan még ma sem azok) használni a nemzetköziesítési fejlesztések eredményeit, esetleg azok próbáltak nyomást gyakorolni...

Ahogy már írtam... nem a megjelenítés volt a probléma, hanem a tárolás... megjeleníteni midnenki úgy jelenít meg egy karaktert ahogy akar.. ha akar akkor pipacsmintás cifrákat lehet a betük köré tenni... de ha csak 256 féle karaktert bír tárolni egy egységben a rendszer akkor ott szopógép van... ez volt az ami zavarta a szakembereket és nem a kalapos/hullámos ö.

z
Előzmény: Kis Ádám (75)
Kis Ádám Creative Commons License 2004.09.01 0 0 78

"Az Unicode

Az Unicode megfeleltetési rendben minden beszélt, holt és egyéb nyelv (pl. Braille) karakterei (betűk, számok, írásjelek, stb.) megtalálhatóak. Minden egyes karakternek egyedi száma és neve van. Emiatt természetesen nem elég a 8 bit: az Unicode eredetileg 16 biten (2 byte -on) tárolta az adatokat, de ez sem volt elég, ezért 4 byte -osra bővítették. Az ISO10664 kezdettől fogva 31 bites. "

 

http://www.bsd.hu/dokumentacio/bevezetes/unicode/view

 

31 bit ha jól számolom, 2 147 483 648 féle betű írását teszi lehetővé. Ebbe azért talán belefér a szanszkrit is.

 

Kis Ádám

Előzmény: Kis Ádám (77)
Kis Ádám Creative Commons License 2004.09.01 0 0 77

ondolod, hogy ez az UCS-4-gyel sem megy?

Kis Ádám

Előzmény: rumci (72)
Kis Ádám Creative Commons License 2004.09.01 0 0 76

Hát, az ó-egyiptomi hieroglofákkal nem lenne különösebb gond. Érdemes lenne ismerkedni kicsit a UNICEDE-dal.

 

Kis Ádám

Előzmény: BZoltan (73)
Kis Ádám Creative Commons License 2004.09.01 0 0 75

Kedves B Zoltán!

 

Ha eddig nem volt érthető, az utf-8 az a UNICODE egy változata, és majdnem minden igaz, amit írtál róla, csak az nem, hogy vietnámi szöveg írásához is ez a célszerű.

 

Ami a lángpallost illeti, egyszer van a magyar nyelv, egyszer van a számítógép. Mindig voltak, akik azt igényelték, hogy a magyar nyelv alkalmazkodjék a számítógéphez, és olyanok, akik ezt fordítva képzelték el. Ami a kalapos ô-t, û-t illeti, nem is olyan rég elég komoly nyomást gyakoroltak bizonyos nyelvészkörökre, hogy a nyelvi norma fogadja el ezt a kompromisszumot. Szerencsére már akkor is el tudtuk mondani, hogy ez nem szükséges, mert csak idő kérdése, hogy a számítógép alkalmazkodjék. A számítógép kb. 40 éve ír, a magyar helyesírásnak ezek a megoldásai kb. 300-400 évesek. Szerencsére a fejlesztők felismerték, hogy még üzleti érdek is ezeket a hagymányokat kiszolgálni, és ezért szorgalmazták a UNICODE kifejlesztését.

 

Kis Ádám

 

 

Előzmény: BZoltan (71)
BZoltan Creative Commons License 2004.09.01 0 0 74
ja egyébként én PC-re is rajzoltam magamnak ékezetes karaktereket... a baj nem is a megjelenítéssel van (amit igyekszem itten nagy lelkesen magyarázni) hanem a tárolással és átvitellel. Ezekre pedig minden szar ami nem univerzális.

z
Előzmény: rumci (72)
BZoltan Creative Commons License 2004.09.01 0 0 73
"aki azt mondja, hogy a Unicode-dal bármilyen nyelven tud írni, azt megkérem, hogy írjon vele szankszrit szövege"

Megeshet az óegyiptomi archaikus hieroglifákkal is bajban lennénk :)

z
Előzmény: rumci (72)
rumci Creative Commons License 2004.09.01 0 0 72
Gyerekek, nekem már a ZX Spectrumom is tudta a rendes (nem kalap, nem hullám, mert az marhaság, különösképp azáltal, hogy o-ból volt hullámos és kalapos is, így még csak nem is volt egyértelmű a kódolás, l. maitre d’hőtel szócikk az 1994-es Bakosban) magyar ékezeteket, sőt a cirill betűket is. Mert megrajzoltam. Most inkább az fj, fí és kurzív gy ligatúrákkal szoktam játszani. A többi nem kérdés. Amúgy oldjuk már fel az UTF betűszót: UCS Transformation Format, magyarán az UTF a Unicode-nak az átviteli formátuma, hiszen általában helytakarékos. Így azon már igazán nem érdemes vitatkozni, hogy UTF vagy UCS; merthogy ugyanaz a kettő. Amúgy aki azt mondja, hogy a Unicode-dal bármilyen nyelven tud írni, azt megkérem, hogy írjon vele szankszrit szöveget – gondban lesz, mert az U+FFFF feletti tartományban sincs a szankszrit (kötelező) ligatúráknak helye.
Előzmény: BZoltan (71)
BZoltan Creative Commons License 2004.09.01 0 0 71
és akkor most miről akarsz meggyőzni engem? :) Arról, hogy az unicode jobb mint az utf-8? Nekem nyolc... én már annak is örülnék ha a sok lámer utf-8-at támogatna... elhiheted, hogy ha én vietnámi nyelven írt levelet kapok, akkor azt abban a formátumban látom ahogy azt küldték és ha továbbküldöm akkor abbana formátumban is kapja meg az akinek én küldöm.
Szóval nyitott ajtókat döngetsz nálam...

a kalapos ékezetes karakterek elleni lángpallosos támadásod szép és logikus... meg igaz is, de nem változtat azon amit én írtam. Hogy az extended ASCII-ben levő kalapos ékezetes karaktereket közmegegyezés szerint használtuk akkoriban értelem szerint. Ha nem lett volna kalapos ö és ü, akkor biztos valamelyik másik karakterben egyeztünk volna meg.
ha pedig valakit zavart a kalaposság az fogta magát és alkalmazás szinten átrajzolta a karaktert.... cirka 10-15 soros rutint kellet a programozónak beleszurni a programjába, hogy ne kalaposnak látszon az ö, hanem ő-nek.

Nem tudom, hogy te akkoriban mivel foglalkoztál, engem már akkor is az csak érdekelt, hogy két tetszőleges kommunikáló fél között ne legyen félreértés és adatveszteség sem... szóval szerintem túldimenzionálod ezt a "deaznemisvóthosszúö" argumentumot.. az volt és punktum. Az volt, mert annak vettük. Mindenkitudta, hogy nem annak szánták aminek mi használjuk, de nekünk attól még franyesz volt és a megoldás az nem a cwi meg latin-x és ilyen kódlap meg olyan kódlap.. hanem a lehető leguniverzálisabb nemzetközileg egységes és támogatott rendszer volt... ahogy most is az.

z
Előzmény: Kis Ádám (70)
Kis Ádám Creative Commons License 2004.09.01 0 0 70

Kedves B Zoltán!

 

Nem tudom, hogy hallottál-e arról, hogy a magyar helyesírás történelmileg alakult ki, és nem véletlen, hogy mely hangot mely betű jelöl. Az általad emlegetett közmegegyezés szerint a hosszan hangzó ajakkerekítéses, első-középső nyelvállású magánhangzó jele a magyarban az ő. És ha a fejed tetejére állsz, akkor is ez marad a közmegegyezés.

 

Valószínűleg arról sem hallottál, hogy nem véletlen, hogy a hosszú ő-n két vessző van, és nem kalap.

Sejtem azt is, hogy amikor a személyi számítógépek magyar nyelvhez idomítása kezdődött, vagy nem figyeltél oda, vagy még nem érdekelt ez a téma. Épp azért, mert az ASCII-7 nem volt figyelemmel - nemcsak a magyar nyelv, hanem az angolon kívül egy más nyelv igényére sem, létrejött Magyarországon egy betűkód, az ú.n. CWI-kód, amelyben lehetett ő-t írni. Hogy ez nem terjedt el, annak köszönhető, hogy a legnagyobb tömegben elterjedt IBM PC-k kódrendszere is megpróbált igazodni a magyar nyelv speciális igényeihez, először a 852-es kódrendszerrel, majd a Latin-2 kibocsátásával, melyekben már megtalálható volt az ő és az ű. Mégpedig a ô és a û helyén. Ez azonban már inkább a kiterjesztett ANSI kóddal valósult meg, és a kódjuk is más:  ő- 0245 és ű-0251.

 

Írod:

"Az utf-8 támogatás erre egy kiválló megoldás.. biztos nem az egytelen...de ilyet nem is mondtam.. viszont a legegyszerübbAz utf-8 támogatás erre egy kiválló megoldás.. biztos nem az egytelen...de ilyet nem is mondtam.. viszont a legegyszerübb"

 

Ennek igazságát senki nem vitatja, azonban bizonyára elkerülte a figyelmedet, hogy az utf-8 egy leegyszerűsített változata a UNICODE-nak. Hétköznapi használatra valóban tökéletes, azonban a teljes körű megoldás a 4-byte-os UNICODE.

 

Ami a vietnámit illeti, azért lehet gond. Ezt találtam a neten:

 

"A W3C ajánlja a Unicode használatát, mint a legáltalánosabb karakterkészletet. Azon belül a magyar nyelv számára az UTF-8 kódolás a legelõnyösebb, míg például az ázsiai nyelveknek az UTF-16 az elõnyösebb. A HTML dokumentumokban a karakter referenciák segítségével további módon is megadhatunk karaktereket."

http://www.w3c.hu/cikkek/intern_tips.html

 

Biztos marhaság, mintahogy az UCS fejlesztése is az, hisz elég az utf-8.

 

Nem gondolod?

 

Kis Ádám

Előzmény: BZoltan (69)
BZoltan Creative Commons License 2004.09.01 0 0 69
"Ha az ACII-ben lenne hosszú ő és hosszú ű, akkor ilyen szót is lehetne írni: kûlônősűl."


Figyusz maistro... elárulok egy titkot... bár lehet, hogy most mérges leszel, mert a dolog masszívan általános iskolás tananyag. Szóval a betűk és a karaketerek azok egy közmegegyezés szerinti jelei a hangoknak. Ha a közmegegyezés a kalocsai mintás ö-t fogadja el hosszú ö-nek akkor az lesz az ö.
Anno az ASCII meghatározásakor ívesen tettek a magyar ékezetes karakterekre... erre utal az ASCII 'A' betüje... viszont az IBM PC nemzetközi elterjedésével az IBM ASCII-z kibővítette.. még mindig nem nekünkl, pipacsvirágos rónaságon született vasmagyaroknak, hanem úgy generál mindenkinek... tettek pontopcskákat, vesszőcskéket, kalapocskákat és hullámocskákat a szabvány karakterek fölé... az adig ékezetlen ungaréze PC betyárok meg virultak és kinevezték a kalapos-hullámos ö-t hosszú ö-nek.
Tehát pontosan egy közmegegyezés volt... ahogy a svédben a 'lk' betü jelöl k-t vagy cs-t és ahogy a spanyolban a 'b' jelölhet b-t vagy v-t... úgy a magyarban a kalapos/hullámos lett elfogadva számítógépes körökben hosszú-nak.
Nyomdaiparban nem lett elfogadva, mert ott más technológával dolgoztak és nem voltak rákényszerítve az ASCII hasunálatára.


"Azt sem egészen értem, hogy miért az utf-8-at emlegeted állandóan, mintha ez lenne az egyetlen megoldás."

Nem vagy egyedül.... az egész probléma onnan ered, hogy egy rakat ostoba fajankó megfeledkezett a nemzetköziesítés fontosságáról. A mai napig sok setét bunkó tolong az IT világában akit baromira nem érdekli, hogy az a levél amit megíra z esetleg olvasható legyen egy arab-héber-amerikai számítógépes környezetben. Az utf-8 támogatás erre egy kiválló megoldás.. biztos nem az egytelen...de ilyet nem is mondtam.. viszont a legegyszerübb.

Ha számítógéoet konfigurálok és belövöm az utf-8 támogatást, akkor vietnámitól kezdve, a cirilen át a magyarig minden nyelvet tudok olvasni és írni is....

z
Előzmény: Kis Ádám (68)
Kis Ádám Creative Commons License 2004.09.01 0 0 68

Az érvelési stílusod érdekes, ettől még igazad nincs. Ha az ACII-ben lenne hosszú ő és hosszú ű, akkor ilyen szót is lehetne írni: kûlônősűl. Mint ahogy a UNICODE-ban le is lehet. Azt sem egészen értem, hogy miért az utf-8-at emlegeted állandóan, mintha ez lenne az egyetlen megoldás.

 

Ahogy ezt a dolgot erőlteted, az azért nem tetszik nekem, mert sokak felfogása szerint elfogadható megoldás a hosszú ő helyettesítése a ô-tel. Ezzel azonban nem értek egyet. Bizonyos szinten ez ugyan megfelelhet, de teljes igényességgel, például nyomtatott könyvben nem.

 

A kódtáblázat hiányosságának áthidalására azonban már akkor is volt módszer, sőt, még az ADCII kialakulása előtt is, mégpedig a repülőékezet alkalmazása. Már a Knuth által kifejlesztett TEX-ben (sajnos, itt nem tudom az E-t süllyeszteni) is lehetett ő-t, ű-t írni. A kódja /H, kifejtve "long hungarian umlaut",  volt.

 

Kis Ádám

 

 

 

Előzmény: BZoltan (65)
BZoltan Creative Commons License 2004.09.01 0 0 67
Igazad van.... hajlamos vagyok az IBM PC Extended ASCII display karakter táblázatát érteni ASCII alatt.
Mentségemül szolgáljon, hogy a gyakorlatban elterjedt ASCII szóhasználat aalatt szinte mindenki ezt a kibővített ASCII-t értette... kivéve a vindózt ami felső 128 kaaktert máshogy definiálta.

z
Előzmény: rumci (66)
rumci Creative Commons License 2004.09.01 0 0 66
Az ASCII-ban nincs se ő. se ű, de még á meg é sincsen. Az ASCII ugyanis csupán a 127-tel záródó tartományt definiálja. Ebből ered, hogy már a Latin-1-es kódtáblák (ISO-8859-1, Windows-1252, MS-DOS 437, illetve 850, Macintosh-10000) is rendesen eltérnek egymástól, a Latin-2-kről (ISO-8859-2, Windows-1250, MS-DOS 852, Macintosh-10029) nem is beszélve.
BZoltan Creative Commons License 2004.08.31 0 0 65
Sőt tulipánmintás Í sincsen és fecskefarkos k sincs.. meg gót betük sincsenek... ehh minek ez a kukacoskodás???

Az ascii-ban _VAN_ hosszú ö és ü... mégpedig a 147 és a 150. Snitt. A megjelenítésük az egy másik műfaly... volt olyan alkalmazás amelyik nem kalaposan jelenítette meg őket...de az igazi megoldást pontosan az utf-8 hozta.

Az érvelésed alapján az é sem é, hanem csek egy e betü vesszővel amit lokalizációfüggően akár é-nek s vehetünk. Az ascii ékezetes karakterei gyakorlatilag ilyen lokális ujrafelhasznált karakterek voltak
Anno amikor még ez az ascii téma volt, alkalmazás szinten lehetett a szöveges karaktereket formázni és bizony bőségesen volt olyan alkalmazás amelyik átrajzolta az ascii táblázat karaktereit.. szóval az, hogy valami hogy néz ki és hogy a közmegegyezés minek fogadja el az sosem volt fix és rögzített dolog... egy átlag nyelvben max 50 karakterre van igény... az ascii az biztosít majdnem 256 karakter. Mindenki ebből oldotta meg a problémáját...de nem szabványosan és nem egységesen... lett is belőle jó sok probléma.... a megoldás az utf-8 :)

z
Előzmény: Kis Ádám (64)

Ha kedveled azért, ha nem azért nyomj egy lájkot a Fórumért!