2010年8月17日 星期二

Regular expression for URL filtering

程式寫到一半,總覺得求方便用程式 Substring + IndexOf 來 Parsing 字串不太好,

Debug 可能也比較麻煩些,因為還要去拆解跟計算 ^^

所以試試看用 Regular Expression 拆解,( 好像更難懂,可是起碼一看就大概知道在做什麼 )

但是上網找了一些 Pattern 好像不太適用目前大部分的情況

ex.
http://WebServer/
http://HP-WebServer:8080/
http://WebServer:1234/login.aspx
ftp://192.168.1.1:2266/


所以自己改寫了一個,

可取得 Protocal ( http, ftp, xml ... )、Domain ( Hostname / IP )、Port ( 如果有的話 )、Path ( 如果有的話 )


(?\w+):\/\/(?[^:/]+):?(?\d*)\/?(?\S*)


沒有留言: