HTML Kódlapok

Innen: IT documentation
A lap korábbi változatát látod, amilyen Moszat (vitalap | szerkesztései) 2020. január 2., 14:43-kor történt szerkesztése után volt.
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

Kódlapok

Ahoz, hogy a böngésző helyesen jelenítse meg a HTML oldalt, tudnia kell, hogy milyen karakter készlettel készült az oldal. A korai világhálón ez a karakter készlet az ASCII volt. Mivel sok nyelv karakterei nem képezik részét az ASCII karakter készletnek, ezért egyéb kódlapokat kell használni. A <meta> tagel lehet beállítani egy weboldal oldal kódlapját.

Megjegyzés: A web kiszolgáló a kapcsolat kezdetén megadhat egy kommunikációs kódlapot. Ez felüldefiniálhatja a HTML dokumentumban megadottat.

ISO kódlapok

A Nemzetközi Szabványügyi Szervezet (International Standards Organization) meghatározza a szabványos karakter-készleteket a különböző nyelvek számára.

Kódlap Meghatározás Leírás
ISO-8859-1 Latin part 1 Észak-Amerika, Nyugat-Európa, Latin-Amerika, Karib-térség, Kanada, Afrika
ISO-8859-2 Latin part 2 Kelet-Európa
ISO-8859-3 Latin part 3 Délkelet-Európa, eszperantó, egyéb
ISO-8859-4 Latin part 4 Skandinávia / Baltikum (és amit nem tartalmaz az ISO-8859-1)
ISO-8859-5 Latin/Cyrillic part 5 Nyelvek, amelyek használják a cirill ábécét. Pl: bolgár, belorusz, orosz és macedón.
ISO-8859-6 Latin/Arabic part 6 Nyelvek, amelyek használják az arab ábécé-t
ISO-8859-7 Latin/Greek part 7 Modern görög nyelv, valamint görög eredetű matematikai szimbólumok
ISO-8859-8 Latin/Hebrew part 8 Nyelvek, amelyek használják a héber ábécé-t
ISO-8859-9 Latin 5 part 9 Török. Ugyanaz, mint az ISO-8859-1, csak egyes izlandi karakterek helyett Török karakterek vannak.
ISO-8859-10 Latin 6 Lappish, Nordic, Eskimo Skandináv nyelvek
ISO-8859-15 Latin 9 (aka Latin 0) Hasonló a ISO 8859-1 -hez, de néhány szimbólumban különbözik.
ISO-2022-JP Latin/Japanese part 1 Japán nyelv
ISO-2022-JP-2 Latin/Japanese part 2 Japán nyelv
ISO-2022-KR Latin/Korean part 1 Koreai nyelv

Az Unicode szabvány

Mivel a kódlapok korlátozott méretűek és nem kompatibilisek a többnyelvű környezettel az Unicode Consortium kidolgozta a Unicode szabványt. A Unicode szabvány lefedi az összes karaktert, írásjelet és szimbólumot a világon. Unicode lehetővé teszi a feldolgozását, tárolását és cseréjét a szöveges adatoknak, függetlenül a platformoktól, programoktól és nyelvektől.

Az Unicode Consortium

Az Unicode Consortium fejleszti a Unicode szabványt. Céljuk, hogy a már létező karakter-készleteket felváltsa az Unicode Transformation Format (UTF). Az Unicode szabványt támogatja számos operációs rendszer és minden modern böngésző. Az Unicode Consortium együttműködik a vezető szabványokat kidolgozó szervezetekkel, mint az ISO, W3C és ECMA. Az Unicode kódlást különböző kódlapoknál lehet használni. A leggyakrabban használt kódlap az UTF-8 és UTF-16.

UTF-8: A karakter az UTF-8 kódolásban 1-4 byte hosszú lehet. Az UTF-8 tartalmaz minden karaktert a Unicode szabványban. Az UTF-8 felülről kompatibilis az ASCII-val. UTF-8 az ajánlott kódolás e-mailek és weboldalak számára.

UTF-16: 16-bites, változó hosszúságú Unicode karakterkódolás, amely képes az összes Unicode típusú kódolásra. UTF-16-ot használják a fő operációs rendszerek és környezetek.