2019-03-05
阅读量:
2442
网页链接中的中文变成了一串百分号间隔的数字
网页链接中的中文变成了一串百分号间隔的数字,怎么将这串字符转换为中文?
答:网页链接(url)中的中文常常会被编码为gbk 或者utf-8
中文的gbk(GB2312)编码: 一个汉字对应两组%xx,即%xx%xx
中文的UTF-8编码: 一个汉字对应三组%xx,即%xx%xx%xx
解码的方法是使用
import urllib
print(urllib.request.unquote('%E4%BD%A0%E5%A5%BD',encoding='utf-8'))
输出:
你好
encoding需要与数据实际的编码类型对应好,否则编码会错误。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论