HTML Kódlapok

Kódlapok

Ahoz, hogy a böngésző helyesen jelenítse meg a HTML oldalt, tudnia kell, hogy milyen karakter készlettel készült az oldal. A korai világhálón ez a karakter készlet az ASCII volt. Mivel sok nyelv karakterei nem képezik részét az ASCII karakter készletnek, ezért egyéb kódlapokat kell használni. A <meta> tagel lehet beállítani egy weboldal oldal kódlapját.

Megjegyzés: A web kiszolgáló a kapcsolat kezdetén megadhat egy kommunikációs kódlapot. Ez felüldefiniálhatja a HTML dokumentumban megadottat.

ISO kódlapok

A Nemzetközi Szabványügyi Szervezet (International Standards Organization) meghatározza a szabványos karakter-készleteket a különböző nyelvek számára.

Kódlap	Meghatározás	Leírás
ISO-8859-1	Latin part 1	Észak-Amerika, Nyugat-Európa, Latin-Amerika, Karib-térség, Kanada, Afrika
ISO-8859-2	Latin part 2	Kelet-Európa
ISO-8859-3	Latin part 3	Délkelet-Európa, eszperantó, egyéb
ISO-8859-4	Latin part 4	Skandinávia / Baltikum (és amit nem tartalmaz az ISO-8859-1)
ISO-8859-5	Latin/Cyrillic part 5	Nyelvek, amelyek használják a cirill ábécét. Pl: bolgár, belorusz, orosz és macedón.
ISO-8859-6	Latin/Arabic part 6	Nyelvek, amelyek használják az arab ábécé-t
ISO-8859-7	Latin/Greek part 7	Modern görög nyelv, valamint görög eredetű matematikai szimbólumok
ISO-8859-8	Latin/Hebrew part 8	Nyelvek, amelyek használják a héber ábécé-t
ISO-8859-9	Latin 5 part 9	Török. Ugyanaz, mint az ISO-8859-1, csak egyes izlandi karakterek helyett Török karakterek vannak.
ISO-8859-10	Latin 6 Lappish, Nordic, Eskimo	Skandináv nyelvek
ISO-8859-15	Latin 9 (aka Latin 0)	Hasonló a ISO 8859-1 -hez, de néhány szimbólumban különbözik.
ISO-2022-JP	Latin/Japanese part 1	Japán nyelv
ISO-2022-JP-2	Latin/Japanese part 2	Japán nyelv
ISO-2022-KR	Latin/Korean part 1	Koreai nyelv

Az Unicode szabvány

Mivel a kódlapok korlátozott méretűek és nem kompatibilisek a többnyelvű környezettel az Unicode Consortium kidolgozta a Unicode szabványt. A Unicode szabvány lefedi az összes karaktert, írásjelet és szimbólumot a világon. Unicode lehetővé teszi a feldolgozását, tárolását és cseréjét a szöveges adatoknak, függetlenül a platformoktól, programoktól és nyelvektől.

Az Unicode Consortium

Az Unicode Consortium fejleszti a Unicode szabványt. Céljuk, hogy a már létező karakter-készleteket felváltsa az Unicode Transformation Format (UTF). Az Unicode szabványt támogatja számos operációs rendszer és minden modern böngésző. Az Unicode Consortium együttműködik a vezető szabványokat kidolgozó szervezetekkel, mint az ISO, W3C és ECMA. Az Unicode kódlást különböző kódlapoknál lehet használni. A leggyakrabban használt kódlap az UTF-8 és UTF-16.

UTF-8: A karakter az UTF-8 kódolásban 1-4 byte hosszú lehet. Az UTF-8 tartalmaz minden karaktert a Unicode szabványban. Az UTF-8 felülről kompatibilis az ASCII-val. UTF-8 az ajánlott kódolás e-mailek és weboldalak számára.

UTF-16: 16-bites, változó hosszúságú Unicode karakterkódolás, amely képes az összes Unicode típusú kódolásra. UTF-16-ot használják a fő operációs rendszerek és környezetek.

Névtelen

Keresés

HTML Kódlapok

Névterek

Több

Lapműveletek

Tartalomjegyzék

Kódlapok

ISO kódlapok

Az Unicode szabvány

Az Unicode Consortium

Navigáció

Navigáció

Tartalmak

Wikieszközök

Wikieszközök

Névtelen

Keresés

HTML Kódlapok

Kódlapok

ISO kódlapok

Az Unicode szabvány

Az Unicode Consortium

Navigáció

Wikieszközök

Eszközök

Kategóriák