zxq997

2018-10-17   阅读量: 1209

数据分析师 Python数据分析

mac电脑使用python导入数据编码问题解决

扫码加入数据分析学习群

问:mac电脑在使用pandas导入数据的时候,有时候会出现中文乱码问题,如图,怎么办?

答:一般在导入数据时,把格式调成python是可以成功导入的。使用参数:engine=‘python’。但是由于编码不同的原因,mac电脑使用不行。

加入参数 encoding=‘utf-8’还是不能成功导入,说明里面存在非‘utf-8‘模式的编码。这时可以选择切换编码模式为 encoding=‘gbk’。

GBK即汉字内码扩展规范,K为扩展的汉语拼音中"扩"字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、

符号883个,并提供1894个造字码位,简、繁体字融于一库。GBK采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE 之间,尾字节在40-FE 之间,

剔除 xx7F一条线。总计23940 个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号883 个。P-Windows3.2和

苹果OS以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
97.1745 7 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子