热线电话:13121318867

登录
2019-03-05 阅读量: 2442
网页链接中的中文变成了一串百分号间隔的数字

网页链接中的中文变成了一串百分号间隔的数字,怎么将这串字符转换为中文?

答:网页链接(url)中的中文常常会被编码为gbk 或者utf-8

中文的gbk(GB2312)编码: 一个汉字对应两组%xx,即%xx%xx

中文的UTF-8编码: 一个汉字对应三组%xx,即%xx%xx%xx

解码的方法是使用

import urllib
print(urllib.request.unquote('%E4%BD%A0%E5%A5%BD',encoding='utf-8'))


输出:
你好

encoding需要与数据实际的编码类型对应好,否则编码会错误。

0.0017
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子