这个函数的功能就是把一段url的域名、路径、文件名等等用数组返回,通过数组的索引访问。

这个函数的核心是一段正则表达式,这段正则表达主要参考了微软的脚本文档。

注释的内容较多,所以各个部分我就不一一说明了。这个函数主要是为了另外的一个功能"通过cookie控制页面跳转"而开发的。下一篇博文,我就会详细介绍。并且附上完整的示例下载。

/********************************************************************
**
**比较通用的正则表达式,捕获url各个部分。
**注意各部分基本上都包含了相应的符号,例如端口号如果捕获成功,那就是':80'
**函数返回一个正则表达式捕获数组。
**注意,现在获得的是一个数组,所以需要通过arr[i]的方式引用。
**正则表达式所有的匹配说明::.........
**$0
**整个url本身。如果$0==null,那就是我的正则有意外,未捕获的可能。
**有一种未捕获的情况已经被发现,那就是域名后面没有以'/'结尾,如:'http://localhost'
**但是经过我的测试,IE和firefox会自动把域名后面加上'/'的。
**$1-$4  协议,域名,端口号,还有最重要的路径path!
**$5-$7  文件名,锚点(#top),query参数(?id=55)
**
*********************************************************************/

 function UrlRegEx(url)
 {
  //如果加上/g参数,那么只返回$0匹配。也就是说arr.length = 0
  var re = /(w+)://([^:|/]+)(:d*)?(.*/)([^#|?|
]+)?(#.*)?(?.*)?/i;
  //re.exec(url);
  var arr = url.match(re);
  return arr;

 }
//--------示例代码:
 function getPath()
 {
  return UrlRegEx(location.href)[4];
 }
二、下面一个函数是获取URL中的主域:
<SCRIPT LANGUAGE="javascript"> <!-- url = "http://club.mil.news.sohu.com/r-shilin-1969040-192/a.php?cid=88"; var domain = UrlRegEx(url); document.write(domain);
function UrlRegEx(url){  var patt = /[w-]+.(com|net|org|gov|cc|biz|info|cn)(.(cn|hk))*/; var arr = url.match(patt); if(arr.length > 0) return arr[0]; else return false;}//-->

</SCRIPT>

原文:http://hi.baidu.com/tonlywang/blog/item/354f38f2775d4bc30a46e086.html