摘要: 这里列出了网页中参见的一些编码。

标签: [编码][/编码]

--通常,中文网站的编码只需要测试这4中,“gbk、utf8、gb2312转utf8”,部分是\u9a8c是这样的,需要用编码“usc2”;

--如果还是不行,那查看一下协议头中是否有编码设置,如果有也设置一下。

gbk                --如:%C9%F1%C6%F7 或 中文 (包含gb2312)

utf8               --如:%E7%A5%9E%E5%99%A8

big5               --如:繁體臺灣論壇 (繁体台湾论坛)

utf8_25          --如:%25E7%25A5%259E%25E5%2599%25A8

gb2312转utf8 --如:绁炲櫒,鎺ㄥ瀛愭墜娉昦sa (这是不常见字或符号,在某些抓包工具里面,可能会显示乱码,只需要复制到规则编辑器,即可显示为文本,如下图。转为这种编码后,文本编辑器中,显示为“乱码”,所以很多时候,是不能转回去的,因为文本编辑器丢失了部分数据。通常,我们提交给服务器的时候,才需要转为utf8,平时乱码显示出来我们也没任何用处。)

url_gbk          --如:http%3A%2F%2Fwzdr论坛  [3.7.1.1以上版本支持]

url_utf8          --如:http%3A%2F%2Fwzdr璁哄潧  [3.7.1.1以上版本支持]

 

[比如下面这个截图,很明显编码是gb2312转utf8]

Chinese_PRC_CI_AS 编码方式_bc

 

[如果以上几个编码发布后,文章依旧乱码,那么可以考虑不设置编码,如 帝国gbk版就不需要设置编码。]

 

usc2            --例1:%u9A8C%u8BC1%u7801%u9519%u8BEF%2C%u4EE3%u7801%3A%28abc123%29 

(转为%u开头,转换 { }[ ]( ):,"  等括号)  

--例2:\u9A8C\u8BC1\u7801\u9519\u8BEF%2C\u4EE3\u7801%3A%28abc123%29

(转为\u开头,转换 { }[ ]( ) :," 等括号)

 

usc2_c 或  usc2_5C      --如:%5C9A8C%5C8BC1%5C7801%5C9519%5C8BEF%2C%5C4EE3%5C7801%3A%28abc123%29 

(转为%5C开头,转换 { }[ ]( ) :," 等括号)

----上面的编码都自动转换了符号,实战中,我们发现转换符号也能正常提交。[2016-04-03]

--以上usc2解码结果为:验证码错误,代码:(abc123)

--以上usc2_* 编码需要3.0.2.6以上版本支持

 

--注意 [编码][/编码] 不能和 [登录编码][/登录编码] 、[发布编码][/发布编码] 共存

错误用法1:
[编码]utf8[/编码] --这个是全局编码标签
[登录编码]gbk[/登录编码] --不能和全局编码标签公用
[发布编码]utf8[/发布编码] --不能和全局编码标签公用

错误用法2:

[发布编码]utf8[/发布编码] --发布编码标签

 

[发布提交网址1]http://t.wzdr.cn/?{usc2_b:{文章标题}} {usc2_b:{文章内容}}[/发布提交网址1] --独立编码标签,不能和发布编码标签、登录编码标签公用,删除上面的发布编码标签即可

 

正确用法1:
[登录编码]gbk[/登录编码]
[发布编码]utf8[/发布编码]

正确用法2:
[编码]utf8[/编码]

--[编码]不应该和 [登录编码]、[发布编码]共存,否则第2次可能会编码返回错误。

 

 

--返回编码标签说明:用于单独返回某个提交网址编码的(也就是解码用的)

 

例(3.2.5.0之前的旧版):

[编码]utf8[/编码]

[登录提交网址1]http://dede57.wzdr.cn/member/index_do.php[/登录提交网址1] 返回编码=gbk;

--支持标签有:返回编码=gbk; 返回编码=utf8; 返回编码=usc2; 返回编码=big5;

例(3.2.5.1新版):

[登录1返回编码]utf8[/登录1返回编码]

[登录提交网址1]http://dede57.wzdr.cn/member/index_do.php[/登录提交网址1]

 

针对[发布*返回编码]标签特殊说明:

准确说,应该是[发布*返回解码],只会解码提交网址返回的文本,并不能进行{文章内容}的编码。

(初期标签文字设置有误,所以一直就这样没改)

 

另外一种特殊情况:

当关键词.txt  或词库txt里面编码为utf-8时,那么发布后的编码{关键词}部分可能会乱码。

异常情况编码为UTF-8:

Chinese_PRC_CI_AS 编码方式_验证码_02

 

正常情况编码为ANSI:

Chinese_PRC_CI_AS 编码方式_验证码_03

 

解决方法,按F8或F9,选择ANSI(936):

Chinese_PRC_CI_AS 编码方式_bc_04

 

另一种特殊情况编码问题:

就是协议头里面含有编码的,那么协议头也得加上,否则编码就会不正确。

Chinese_PRC_CI_AS 编码方式_验证码_05

例:[登录协议头1]Content-Type: application/json; charset=utf-8[/登录协议头1]

 

关于注册时,汉字帐号的编码问题:

例1:

[登录提交数据1]username={随机姓氏=汉}{随机汉字=2}&usertel=133{随机数字=8}&answerid=5760[/登录提交数据1]

--由于这个是gbk编码的,所以可以直接提交汉字标签就可以了,可以不进行编码转换

 

如果遇到其他utf8编码的,才需要下面的标签来处理:

例2:(独立编码需要3.044以上版本支持)

[登录提交网址2]http://t.wzdr.cn/?{utf8:{随机姓氏=汉}}{utf8:{随机汉字=2}}[/登录提交网址2]

 

Chinese_PRC_CI_AS 编码方式_验证码_06

 

例3:

[登录提交网址1]http://t.wzdr.cn/?{utf8:{词库1}}、{utf8:{词库1}}、{utf8:{词库1}}、{utf8:{词库2}}|{随机姓氏=汉}|{utf8:{变量1}}|不编码:{词库1}|{utf8:{随机姓氏=汉}}自定义:{utf8:测试abc}[/登录提交网址1]

[登录提交网址2]http://t.wzdr.cn/?{utf8:{随机姓氏=汉}}{utf8:{随机汉字=2}}[/登录提交网址2]

[发布前提交网址1]http://t.wzdr.cn/jb1.html[/发布前提交网址1]

[发布前提交1参数1](.*?)"

test2="888"[/发布前提交1参数1]

[发布提交网址1]http://t.wzdr.cn/?{utf8:{发布前提交1参数1}}[/发布提交网址1]

 

例4:

[发布验证码]http://open.soft.360.cn/img.php?nowtime=1421670566945[/发布验证码]

[发布1返回编码]usc2[/发布1返回编码]

[发布提交网址1]http://t.wzdr.cn/?{utf8:{发布验证码}}[/发布提交网址1]

[发布提交数据1]t={utf8:{文章标题}}&b={utf8:{文章内容}}[/发布提交数据1]

Chinese_PRC_CI_AS 编码方式_验证码_07

 

例5:

[发布成功特征1]>发表于 <===发布成功了哦。。。{gbk解码:{关键词}}[/发布成功特征1] --如果中文关键词输出到工作日志,可能会被编码,那么需要在这里手动解码

 

3.148以后版本支持独立解码,如:{utf8解码:{登录提交1参数3}} 、{usc2解码:{词库1}} 

更多解码支持:utf8解码 base64解码 gbk解码 utf8转gb2312 usc2解码 

 

Q、解码标签一般什么时候才用?

 

答:某些时候,解码的内容并不能完整还原,所以我们一般提交数据不需要用到解码标签。这个标签的目的,是为了在特殊情况下,让工作日志显示某些内容。(如下)

[发布成功特征1]ok====发布成功,当前账号:{utf8解码:{发布前提交1参数1}}[/发布成功特征1]

[发布成功特征1]ok====发布成功,标题:{utf8解码:{文章标题}}[/发布成功特征1]

 

 

例6:

关于符号“$/+=:”的编码转换问题

以前旧版,没有独立的编码转换标签,所以我们使用替换标签来编码这些符号。现在的新版,完全可以采用独立编码标签来转换,非常方便。

规则:

[登录提交网址1]c:\1.txt[/登录提交网址1] --txt存放内容为:$/+=:

[登录提交1参数1](.*)[/登录提交1参数1] --正则取txt里面全部文本

[登录提交网址2]http://t.wzdr.cn/?{utf8:{登录提交1参数1}}?{md5:{密码}}[/登录提交网址2] --独立编码参数1

 

[登录提交网址1]http://t.wzdr.cn/?{base64:{词库1}}[/登录提交网址1]

 

报告:

■■■■■■■■[20:34:16] 登录提交网址1 【处理前】: c:\1.txt

■■■■■■■■[20:34:16] 登录提交网址1 【处理后】: c:\1.txt

■■■■■■■■[20:34:16] 登录提交网址1 【返回】: $/+=:

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 处理前】: (.*)

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 处理后】: (.*)

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 结果】: $/+=:

■■■■■■■■[20:34:16] 登录提交网址2 【处理前】: http://t.wzdr.cn/?{utf8:{登录提交1参数1}}

■■■■■■■■[20:34:16] 登录提交网址2 【处理后】: http://t.wzdr.cn/?%24%2F%2B%3D%3A

■■■■■■■■[20:34:16] 登录提交网址2 【返回】:

 

更多md5加密标签:

{md5:{密码}}

{md5_32:{密码}}

{md5_32_大写:{密码}}

{md5_16:{密码}}

{md5_16_大写:{密码}}

 

 

Q、其他相关

 

escape --Escape编码 %u795E%u5668%20wzdr

escape_25 --Escape编码 ,把“%”替换为“%25”

encode --Encode编码 %C9%F1%C6%F7%20wzdr

加密3DES、解密3DES

 

Q、如何让不同的规则,设置不同的文章编码?

 


标签: [编码][/编码]

--通常,中文网站的编码只需要测试这4中,“gbk、utf8、gb2312转utf8”,部分是\u9a8c是这样的,需要用编码“usc2”;

--如果还是不行,那查看一下协议头中是否有编码设置,如果有也设置一下。

gbk                --如:%C9%F1%C6%F7 或 中文 (包含gb2312)

utf8               --如:%E7%A5%9E%E5%99%A8

big5               --如:繁體臺灣論壇 (繁体台湾论坛)

utf8_25          --如:%25E7%25A5%259E%25E5%2599%25A8

gb2312转utf8 --如:绁炲櫒,鎺ㄥ瀛愭墜娉昦sa (这是不常见字或符号,在某些抓包工具里面,可能会显示乱码,只需要复制到规则编辑器,即可显示为文本,如下图。转为这种编码后,文本编辑器中,显示为“乱码”,所以很多时候,是不能转回去的,因为文本编辑器丢失了部分数据。通常,我们提交给服务器的时候,才需要转为utf8,平时乱码显示出来我们也没任何用处。)

url_gbk          --如:http%3A%2F%2Fwzdr论坛  [3.7.1.1以上版本支持]

url_utf8          --如:http%3A%2F%2Fwzdr璁哄潧  [3.7.1.1以上版本支持]

 

[比如下面这个截图,很明显编码是gb2312转utf8]

Chinese_PRC_CI_AS 编码方式_bc

 

[如果以上几个编码发布后,文章依旧乱码,那么可以考虑不设置编码,如 帝国gbk版就不需要设置编码。]

 

usc2            --例1:%u9A8C%u8BC1%u7801%u9519%u8BEF%2C%u4EE3%u7801%3A%28abc123%29 

(转为%u开头,转换 { }[ ]( ):,"  等括号)  

--例2:\u9A8C\u8BC1\u7801\u9519\u8BEF%2C\u4EE3\u7801%3A%28abc123%29

(转为\u开头,转换 { }[ ]( ) :," 等括号)

 

usc2_c 或  usc2_5C      --如:%5C9A8C%5C8BC1%5C7801%5C9519%5C8BEF%2C%5C4EE3%5C7801%3A%28abc123%29 

(转为%5C开头,转换 { }[ ]( ) :," 等括号)

----上面的编码都自动转换了符号,实战中,我们发现转换符号也能正常提交。[2016-04-03]

--以上usc2解码结果为:验证码错误,代码:(abc123)

--以上usc2_* 编码需要3.0.2.6以上版本支持

 

--注意 [编码][/编码] 不能和 [登录编码][/登录编码] 、[发布编码][/发布编码] 共存

错误用法1:
[编码]utf8[/编码] --这个是全局编码标签
[登录编码]gbk[/登录编码] --不能和全局编码标签公用
[发布编码]utf8[/发布编码] --不能和全局编码标签公用

错误用法2:

[发布编码]utf8[/发布编码] --发布编码标签

 

[发布提交网址1]http://t.wzdr.cn/?{usc2_b:{文章标题}} {usc2_b:{文章内容}}[/发布提交网址1] --独立编码标签,不能和发布编码标签、登录编码标签公用,删除上面的发布编码标签即可

 

正确用法1:
[登录编码]gbk[/登录编码]
[发布编码]utf8[/发布编码]

正确用法2:
[编码]utf8[/编码]

--[编码]不应该和 [登录编码]、[发布编码]共存,否则第2次可能会编码返回错误。

 

 

--返回编码标签说明:用于单独返回某个提交网址编码的(也就是解码用的)

 

例(3.2.5.0之前的旧版):

[编码]utf8[/编码]

[登录提交网址1]http://dede57.wzdr.cn/member/index_do.php[/登录提交网址1] 返回编码=gbk;

--支持标签有:返回编码=gbk; 返回编码=utf8; 返回编码=usc2; 返回编码=big5;

例(3.2.5.1新版):

[登录1返回编码]utf8[/登录1返回编码]

[登录提交网址1]http://dede57.wzdr.cn/member/index_do.php[/登录提交网址1]

 

针对[发布*返回编码]标签特殊说明:

准确说,应该是[发布*返回解码],只会解码提交网址返回的文本,并不能进行{文章内容}的编码。

(初期标签文字设置有误,所以一直就这样没改)

 

另外一种特殊情况:

当关键词.txt  或词库txt里面编码为utf-8时,那么发布后的编码{关键词}部分可能会乱码。

异常情况编码为UTF-8:

Chinese_PRC_CI_AS 编码方式_验证码_02

 

正常情况编码为ANSI:

Chinese_PRC_CI_AS 编码方式_验证码_03

 

解决方法,按F8或F9,选择ANSI(936):

Chinese_PRC_CI_AS 编码方式_bc_04

 

另一种特殊情况编码问题:

就是协议头里面含有编码的,那么协议头也得加上,否则编码就会不正确。

Chinese_PRC_CI_AS 编码方式_验证码_05

例:[登录协议头1]Content-Type: application/json; charset=utf-8[/登录协议头1]

 

关于注册时,汉字帐号的编码问题:

例1:

[登录提交数据1]username={随机姓氏=汉}{随机汉字=2}&usertel=133{随机数字=8}&answerid=5760[/登录提交数据1]

--由于这个是gbk编码的,所以可以直接提交汉字标签就可以了,可以不进行编码转换

 

如果遇到其他utf8编码的,才需要下面的标签来处理:

例2:(独立编码需要3.044以上版本支持)

[登录提交网址2]http://t.wzdr.cn/?{utf8:{随机姓氏=汉}}{utf8:{随机汉字=2}}[/登录提交网址2]

 

Chinese_PRC_CI_AS 编码方式_验证码_13

 

例3:

[登录提交网址1]http://t.wzdr.cn/?{utf8:{词库1}}、{utf8:{词库1}}、{utf8:{词库1}}、{utf8:{词库2}}|{随机姓氏=汉}|{utf8:{变量1}}|不编码:{词库1}|{utf8:{随机姓氏=汉}}自定义:{utf8:测试abc}[/登录提交网址1]

[登录提交网址2]http://t.wzdr.cn/?{utf8:{随机姓氏=汉}}{utf8:{随机汉字=2}}[/登录提交网址2]

[发布前提交网址1]http://t.wzdr.cn/jb1.html[/发布前提交网址1]

[发布前提交1参数1](.*?)"

test2="888"[/发布前提交1参数1]

[发布提交网址1]http://t.wzdr.cn/?{utf8:{发布前提交1参数1}}[/发布提交网址1]

 

例4:

[发布验证码]http://open.soft.360.cn/img.php?nowtime=1421670566945[/发布验证码]

[发布1返回编码]usc2[/发布1返回编码]

[发布提交网址1]http://t.wzdr.cn/?{utf8:{发布验证码}}[/发布提交网址1]

[发布提交数据1]t={utf8:{文章标题}}&b={utf8:{文章内容}}[/发布提交数据1]

Chinese_PRC_CI_AS 编码方式_验证码_07

 

例5:

[发布成功特征1]>发表于 <===发布成功了哦。。。{gbk解码:{关键词}}[/发布成功特征1] --如果中文关键词输出到工作日志,可能会被编码,那么需要在这里手动解码

 

3.148以后版本支持独立解码,如:{utf8解码:{登录提交1参数3}} 、{usc2解码:{词库1}} 

更多解码支持:utf8解码 base64解码 gbk解码 utf8转gb2312 usc2解码 

 

Q、解码标签一般什么时候才用?

 

答:某些时候,解码的内容并不能完整还原,所以我们一般提交数据不需要用到解码标签。这个标签的目的,是为了在特殊情况下,让工作日志显示某些内容。(如下)

[发布成功特征1]ok====发布成功,当前账号:{utf8解码:{发布前提交1参数1}}[/发布成功特征1]

[发布成功特征1]ok====发布成功,标题:{utf8解码:{文章标题}}[/发布成功特征1]

 

 

例6:

关于符号“$/+=:”的编码转换问题

以前旧版,没有独立的编码转换标签,所以我们使用替换标签来编码这些符号。现在的新版,完全可以采用独立编码标签来转换,非常方便。

规则:

[登录提交网址1]c:\1.txt[/登录提交网址1] --txt存放内容为:$/+=:

[登录提交1参数1](.*)[/登录提交1参数1] --正则取txt里面全部文本

[登录提交网址2]http://t.wzdr.cn/?{utf8:{登录提交1参数1}}?{md5:{密码}}[/登录提交网址2] --独立编码参数1

 

[登录提交网址1]http://t.wzdr.cn/?{base64:{词库1}}[/登录提交网址1]

 

报告:

■■■■■■■■[20:34:16] 登录提交网址1 【处理前】: c:\1.txt

■■■■■■■■[20:34:16] 登录提交网址1 【处理后】: c:\1.txt

■■■■■■■■[20:34:16] 登录提交网址1 【返回】: $/+=:

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 处理前】: (.*)

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 处理后】: (.*)

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 结果】: $/+=:

■■■■■■■■[20:34:16] 登录提交网址2 【处理前】: http://t.wzdr.cn/?{utf8:{登录提交1参数1}}

■■■■■■■■[20:34:16] 登录提交网址2 【处理后】: http://t.wzdr.cn/?%24%2F%2B%3D%3A

■■■■■■■■[20:34:16] 登录提交网址2 【返回】:

 

更多md5加密标签:

{md5:{密码}}

{md5_32:{密码}}

{md5_32_大写:{密码}}

{md5_16:{密码}}

{md5_16_大写:{密码}}

 

 

Q、其他相关

 

escape --Escape编码 %u795E%u5668%20wzdr

escape_25 --Escape编码 ,把“%”替换为“%25”

encode --Encode编码 %C9%F1%C6%F7%20wzdr

加密3DES、解密3DES

 

Q、如何让不同的规则,设置不同的文章编码?