ksino's diary

覚えたことを忘れないように、小さなことでも書いていく。

URLを正規表現で分解する

RFC2396を参考に。
http://www.ietf.org/rfc/rfc2396.txt
こんな正規表現を書くと

^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?

以下が取り出せる。

$2 スキーム
$4 サーバアドレス
$5 パス
$7 クエリ
$9 フラグメント