URL--编码解码那些事

  • 1 JS对URL字符串进行编码/解码分析
  • 1.1 为什么要对URL编码和解码?
  • 1.2 js对URL编码和解码
  • 1.2.1 escape()
  • 1.2.2 encodeURI()
  • 1.2.3 encodeURIComponent()


1 JS对URL字符串进行编码/解码分析

1.1 为什么要对URL编码和解码?

只有字母和数字[0-9a-zA-Z]、一些特殊符号“$-_.+!*’(),”[不包括双引号]、以及某些保留字,才可以不经过编码直接用于URL

URL包含汉字

当我们在百度引擎搜索百度百科,网址是这样的

url解码python3 url解码原理_js


url解码python3 url解码原理_Web前端_02


当你复制图一的URL,粘贴(到别的地方)在这里就变成了:https://www.baidu.com/s?ie=UTF-8&wd=%E7%99%BE%E5%BA%A6%E7%99%BE%E7%A7%91

URL中的汉字被转换成了字符

1.2 js对URL编码和解码

js有三个常用的方法,可以对URL编码解码

escape()、unescape()
 encodeURI(), decodeURI()
 encodeURIComponent() 、decodeURIComponent()

ps:
无论网页的原始编码是什么,一旦被Javascript编码,就都变为unicode字符.也就是说,Javascipt函数的输入和输出,默认都是Unicode字符。

1.2.1 escape()

返回一个可在所有计算机上读取的编码 String 对象。
不会被此方法编码的字符: @ * / +

实际上,escape()不能直接用于URL编码,它的真正作用是返回一个字符的Unicode编码值。比如“春节”的返回结果 是%u6625%u8282,也就是说在Unicode字符集中,“春”是第6625个(十六进制)字符,“节”是第8282个(十六进制)字符。

它的具体规则是,除了ASCII字母、数字、标点符号“@ * _ + - . /”以外,对其他所有字符进行编码。在\u0000到\u00ff之间的符号被转成%xx的形式,其余符号被转成%uxxxx的形式。

escape('努力') // %u52AA%u529B
unescape("%u52AA%u529B") // 努力

url解码python3 url解码原理_URL_03

1.2.2 encodeURI()
encodeURI('努力') // "%E5%8A%AA%E5%8A%9B"
decodeURI("%E5%8A%AA%E5%8A%9B") // "努力"

url解码python3 url解码原理_URL_04

1.2.3 encodeURIComponent()

该方法与encodeURI()的区别是,该方法对URL的组成部分进行个别编码,而不用于对整个URL进行编码,
因此,“; / ? : @ & = + $ , #”,这些在encodeURI()中不被编码的符号,在encodeURIComponent()中统统会被编码。至于具体的编码方法,两者是一样。
实际应用中推荐用该方法

encodeURIComponent('努力') // %E5%8A%AA%E5%8A%9B
decodeURIComponent('%E5%8A%AA%E5%8A%9B') // 努力

url解码python3 url解码原理_Web前端_05