Következő: 15.8.8.3 Egybeolvasott szimbólumok
Fel: 15.8.8 MINTÁK ÉS TEVÉKENYSÉGEK
Előző: 15.8.8.1 Minták
  Index
A reguláris kifejezések az egrep-ben megtalálható kibővített típusúak. A
következő karakterekből állnak:
- c
- a nem-metakarakter c-re illeszkedik.
- ¸
- a literális c karakterre illeszkedik.
- .
- minden karakterre illeszkedik, beleértve az újsort.
- ^
- egy sztring kezdetére illeszkedik.
- $
- egy sztring végére illeszkedik.
- [abc...]
- karakterlista, amely az abc...karakterek bármelyikére
illeszkedik.
- [^abc...]
- negált karakterlista, minden karakterre illeszkedik,
kivéve abc...-t.
- r1|r2
- vagylagosság: r1-re vagy r2-re illeszkedik.
- r1r2
- összekapcsolás: az r1 és r2 sorozatra illeszkedik.
- r+
- egy vagy több r-re illeszkedik.
- r*
- nulla vagy több r-re illeszkedik.
- r?
- nulla vagy egy r-re illeszkedik.
- (r)
- csoportosítás: r-re illeszkedik.
- r{n}
- r{n,}
- r{n,m}
- Egy vagy két szám kapcsos zárójelek között
intervallum-kifejezést jelent. Ha egy szám szerepel a zárójelek között, az
előtte álló r reguláris kifejezés n-szer megismétlődik. Ha két szám van
zárójelezve, vesszővel elválasztva, rnés m közötti számszor ismétlődik meg.
Ha egy számot követ vessző, ez r legalább n-szeri ismétlését jelzi. Az
intervallum-kifejezések csak akkor használhatók, ha a parancssorban -posix
vagy -re-interval opciót jelölünk meg.
- \y
- egyszó elején vagy végén álló üres sztringre illeszkedik.
- \B
- egyszón belüli üres sztringre illeszkedik.
- \<
- egyszó elején álló üres sztringre illeszkedik.
- \>
- egyszó végén álló üres sztringre illeszkedik.
- \w
- minden szóalkótó karakterre (betű, szám, aláhúzás)
illeszkedik.
- \W
- minden nem-szóalkótó karakterre illeszkedik.
- \`
- egypuffer (sztring) elején álló üres sztringre
illeszkedik.
- \'
- egypuffer végén álló üres sztringre illeszkedik.
A sztringkonstansokban érvényes escape szekvenciák (lásd lejjebb) szintén
használhatók a reguláris kifejezésekben.
A karakterosztály a POSIX szabványban bevezetett új lehetőség. A
karakterosztály egy speciális jelölés adott attribútumú karakterek leírásához,
ahol viszont a tulajdonképpeni karakterek ország és ország és/vagy
karakterkészlet és karakterkészlet között mások lehetnek. Például az
alfabetikus karakter fogalma mást jelent az USAban és mást Franciaországban.
A karakterosztályok csak a karakterlista szögletes zárójelein belüli reguláris
kifejezésben használhatók. Formájuk: [:, az osztályt jelölő kulcsszó és :].
Íme a POSIX szabványban definiált karakterosztályok.
- [:alnum:]
- Alfanumerikus karakterek.
- [:alpha:]
- Alfabetikus karakterek.
- [:blank:]
- Space vagy tab karakterek.
- [:cntrl:]
- Vezérlő karakterek.
- [:digit:]
- Numerikus karakterek.
- [:graph:]
- Látható és nyomtatható karakterek. (A space nyomtatható, de
nem látható, míg egy a mindkettő.)
- [:lower:]
- Kisbetűs alfabetikus karakterek.
- [:print:]
- Nyomtatható karakterek (nem vezérlő karakterek.)
- [:punct:]
- Írásjelek (nem betű-, szám-, vezérlő vagy space karakterek).
- [:space:]
- Space karakterek (úgy mint például space, tab és lapdobás).
- [:upper:]
- Nagybetűs alfabetikus karakterek.
- [:xdigit:]
- Hexadecimális számkarakterek.
Példának okáért, a POSIX szabvány előtt, az alfanumerikus karakterekre
illeszkedést a /[A-Za-z0-9]/ leírásával lehetett volna elérni. Ha
karakterkészletünkben egyéb alfabetikus karakterek is vannak, ez nem fog
illeszkedni rájuk. A POSIX karakterosztályt használvaa/[[:alnum:]]/ forma
illeszkedni fog a karakterkészlet minden alfabetikus és numerikus karakterére.
Két további speciális szekvencia is megjelenhet a karakterlistákban. Ezek
nem-ASCII karakterkészletekre vonatkoznak, amelyeknek lehetnek olyan
szimbólumaik (egybeolvasott elemek), amelyek több, mint egy karakterrel vannak
ábrázolva, és számos olyan karakter is, amelyek összehasonlító vagy rendező
szempontból egyenértékűek. (pl. a francia nyelvben a sima ,,e'' és a
tompaékezetes e` egyenértékűek.)
Következő: 15.8.8.3 Egybeolvasott szimbólumok
Fel: 15.8.8 MINTÁK ÉS TEVÉKENYSÉGEK
Előző: 15.8.8.1 Minták
  Index
1999-09-17