Ez a függvény a data paraméterben átadott sztringet UTF-8 szerint kódolja, és ezt a kódolt alakot adja vissza. Az UTF-8 az Unicode szabványos módszere a hosszú karakterek értékének bájtfolyamba kódolására. Az UTF-8 átlátszó megoldás a sima ASCII karakterek esetén, és ön-szinkronizáló (azaz a programok meg tudják határozni, hogy hol kezdődnek a karakterek a bájtfolyamon belül) és a hagyományos összehasonlító-függvényekkel és egyebekkel együtt is használhatók. PHP az UTF-8 karaktereket 4 bájtos hosszig az alábbiak szerint kódolja:
Ahol minden b egy bitet jelent, amit karakter tárolásához használható.