next up previous contents
Next: 4.1.2 位置指定 Up: 4.1 PCREの正規表現 Previous: 4.1 PCREの正規表現

4.1.1 文字とメタ文字

正規表現では、英数文字はその文字を表す。一方、以下の文字はメタ文字と 呼ばれて特殊な意味がある。

    \  |  (  )  {  }  ^  $  *  +  ?  .

この中で、. (ドット)は任意の一文字にマッチします。

    .    任意の一文字にマッチ
そのために、正規表現.abc は、 aabc, babc, cabc, ..., Aabc, ..., #abc, ... などにマッチします。

それ以外のメタ文字については以下で順に解説します。

これらのメタ文字を直接指定したい場合には、その前にバックスラッシュ "(日本語キーボードでは "¥" )をつけます。

メタ文字自身
    \\  \|  \(  \)  \{  \}  \^  \$  \*  \+  \?  \.

一方、英数字の前にバックスラッシュ "がつくと、逆に別の意味を持ち、 下にまとめたような文字、あるいは境界などを意味します。

\A 文字列先頭
\Z 文字列末尾
\b 単語境界
\B 単語境界以外
\w 英数字と '_'(アンダースコア)
\W 英数字と '_'(アンダースコア)以外
\s 空白文字 ( ' '(スペース), '\t', '\n', '\r' )
\S 空白文字以外
\d 数字 (0...9)
\D 数字以外
\t タブ文字
\n 改行文字 (\0x0d)
\r 復帰文字 (\0x0a)
\xHH 2桁の16進数(HH)で指定される文字コード

この他、\1 のような、バックスラッシュの後ろに数字を置くと、 部分文字列を後に参照するための後方参照となるが、これは後に述べることに する。



Noriyo Kanayama