13.3.5.1 Mi az a unicode?

Következő: 13.3.6 Mi az a Fel: 13.3.5 Kicsit haladóbbaknak... Előző: 13.3.5 Kicsit haladóbbaknak... Index

13.3.5.1 Mi az a unicode?

Az egyes nemzeti karaktereket egységes megnevezési konvenciók szerint bejegyezték, és megszámoztak. Egységes rövidítéseket is kitaláltak nekik, ezeket is szabványosították. Az ,,aacute'' és az ,,ouml'' biztosan ismerős, ez a POSIX.2 szabvany része. (A .html lapoknál használnak ilyen jelöléseket az ékezetes betűkre)

Minden betűt 2 byte-tal írunk le, az első 256 karakter a Latin-2 kódlap, de benne van (igaz, nem ilyen összefüggően) az összes európai nemzeti betű, a görög/japán/kínai/orosz betűk, (c), (r), a ,,végtelen'', kis ordo, nagy ordo (Hej, ALLINPHOS people!), a VGA ROM vidám pofa/szomorú pofa karaktere, a blokkgrafika (vonalgrafika), és egyáltalán minden, amit csak az ember el tud képzelni.

Például a magyar hosszú A' betű (Á) neve: ,,latin capital letter a with acute'', kódja U+00c1, es hívható 'Aacute' vagy A' néven.

Így nemzetközi dokumentumokban (mondjuk egy .html lap) egyértelműen hivatkozhatunk bármilyen betűre.

Részletesebb info, és sok-sok kódlap kiosztása található az rfc1345-ben. (cím ebben a fejezetben)

1999-09-17