encodeURI 和 encodeURIComponent都是ECMA-262标准中定义的函数,所有兼容这个标准的语言(如javascript,ActionScript)都会实现这两个函数。
它们都是用来对URI (RFC-2396)字符串进行编码的全局函数,但是它们的处理方式和使用场景有所不同。
首先,需要理解RFC-2396中对于URI中的字符分类。
保留字符(reserved characters):这类字符是URI中的保留关键字符,它们用于分割URI中的各个部分。
这些字符是:";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","。
Mark字符(mark characters):这类字符在RFC-2396中特别定义,但是没有特别说明用途,可能是和别的RFC标准相关。
这些字符是:"-" | "_" | "." | "!" | "~" | "*" | "'" | "(" | ")"
基本字符(alphanum characters):这类字符是URI中的主体部分,它包括所有的大写字母、小写字母和数字。
有了以上的基础适应,就可以很容易地解释encodeURI和encodeURIComponent函数的不同之处了:
encodeURI: 该函数对传入字符串中的所有非(基本字符、Mark字符和保留字符)进行转义编码(escaping)。所有的需要转义的字符都按照UTF-8编码转化成为一个、两个或者三个字节的十六进制转义字符(%xx)。例如,字符空格" "转换成为"%20"。在这种编码模式下面,需要编码的ASCII字符用一个字节转义字符代替,在u0080和u007ff之间的字符用两个字节转义字符代替,其他16为Unicode字符用三个字节转义字符代替。
encodeURIComponent: 该函数处理方式和encodeURI只有一个不同点,那就是对于保留字符同样做转义编码。例如,字符":"被转义字符"%3A"代替
之所以有上面两个不同的函数,是因为我们在写JS代码的时候对URI进行两种不同的编码处理需求。encodeURI可以用来对完整的URI字符串进行编码处理。而encodeURIComponent可以对URI中一个部分进行编码,从而让这一部分可以包含一些URI保留字符。这在我们日常编程中是十分有用的。
例如这样的URI字符串:
http://www.jb200.com/send-to-friend.aspx?url=http://www.jb200.com/product.html
在这个URI字符串中。send-to-friend.aspx页面会创建HTML格式的邮件内容,里面会包含一个链接,这个链接的地址就是上面URI字符串中的url值。显然上面的url值是URI中的一个部分,里面包含了URI保留关键字符。我们必须调用encodeURIComponent对它进行编码后使用,否则上面的URI字符串会被浏览器认为是一个无效的URI。
正确的URI应该是这样:
http://www.jb200.com/send-to-friend.aspx?url=http%3A%2F%2Fwww.jb200.com%2Fproduct.html
下面来看几个简单的例子。
1、encodeURI
输出:
my%20test.asp?name=st%C3%A5le&car=saab
2、encodeURIComponent
输出:
http%3A%2F%2Fjb200.com%2Fmy%20test.asp%3Fname%3Dst%C3%A5le%26car%3Dsaab
其他
在ECMA-262标准中,还定义了和这两个encode函数向对应的decode全局函数,它们是decodeURI和decodeURIComponent。
可以用它们来decode编码后的字符串。
就是这些内容了,理论加示例,帮助大家了解encodeURI和encodeURIComponent的基本用法,希望对大家有所帮助。