Az egyes nemzeti karaktereket egységes megnevezési konvenciók szerint bejegyezték, és megszámoztak. Egységes rövidítéseket is kitaláltak nekik, ezeket is szabványosították. Az ,,aacute'' és az ,,ouml'' biztosan ismerős, ez a POSIX.2 szabvany része. (A .html lapoknál használnak ilyen jelöléseket az ékezetes betűkre)
Minden betűt 2 byte-tal írunk le, az első 256 karakter a Latin-2 kódlap, de benne van (igaz, nem ilyen összefüggően) az összes európai nemzeti betű, a görög/japán/kínai/orosz betűk, (c), (r), a ,,végtelen'', kis ordo, nagy ordo (Hej, ALLINPHOS people!), a VGA ROM vidám pofa/szomorú pofa karaktere, a blokkgrafika (vonalgrafika), és egyáltalán minden, amit csak az ember el tud képzelni.
Például a magyar hosszú A' betű (Á) neve: ,,latin capital letter a with acute'', kódja U+00c1, es hívható 'Aacute' vagy A' néven.
Így nemzetközi dokumentumokban (mondjuk egy .html lap) egyértelműen hivatkozhatunk bármilyen betűre.
Részletesebb info, és sok-sok kódlap kiosztása található az rfc1345-ben.
(cím
ebben a fejezetben)