Python-数据科学专业问答社区-CDA答疑社区

热线电话：13121318867

登录

LXM21

python列表的切片

这中间加个[0]是啥意思回复:键2的值是一个列表,要取出键2.1的值,需要先对列表切片.列表是通过的切片的方式获取值字典是通过键访问值

137.5007

1

0

0

关注作者

收藏

LXM21

python字典的特性

1、字典的键不能有重复，值是可以重复2、必须是不可变的数据类型才能作为字典的键，元祖可以做字典的键，但是元祖里不能包括可变的列表

10.1140

1

0

0

关注作者

收藏

liting李

python字符串切割：str.split()和re.split()对比

1、str.split不支持正则及多个切割符号，不感知空格的数量，比如用空格切割，会出现下面情况。>>> s1="aa bb cc">>> s1.split(' ')['aa', 'bb', '', 'cc']因此split只适合简单的字符分割2、re.split，支持正则及多个字符切割>>> print lineabc aa;bb,cc | dd(xx).xxx 12.12'xxxx按空格

66.9587

2

0

0

关注作者

收藏

liting李

python中groupby 函数的用法

于数据的分组和分组运算主要是指groupby函数的应用，具体函数的规则如下：df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性，数据的限定定语，可以有多个).mean()(对于数据的计算方式——函数名称)举例如下：print(df["评分"].groupby([df["地区"],df["类型"]]).mean())#上面语句的功能是输出表格所有数据中

62.9467

1

0

0

关注作者

收藏

LXM21

python提示：KeyboardInterrupt

运行提示：KeyboardInterrupt回复：KeyboardInterrupt：用户中断执行。执行时被自己打断了，再执行一下即可

62.9467

1

0

0

关注作者

收藏

LXM21

str.replace第三个参数

当replace第三个参数为-1时全部替换是怎么回事？回复：这里可以不用设置第三个参数，因为它默认的就是-1，替换全部

73.0607

2

0

0

关注作者

收藏

LXM21

python中str.replace

如果是负数怎样替换回复：为负时都是全部替换，不需设置第三个参数，一般不会写负数，根据需求需要替换多少次写几就可以了

73.0607

2

0

0

关注作者

收藏

LXM21

安装好anaconda后没有IPython

回复：IPython之前是单独的一个模块，现在集成到Anaconda里了

73.4180

4

0

0

关注作者

收藏

LXM21

python打印时需注意内容使用的引号

如果需要用两次引号，需要单双引号混用，并且成对使用

0.3572

2

0

0

关注作者

收藏

LXM21

Python中round()函数遇到0.5时，取距离原数值最近的一个偶数

63.1855

2

0

0

关注作者

收藏

LXM21

python取得iris不写路径吗？那怎么取得呢？运行报错了

取得iris不写路径吗？那怎么取得呢？运行报错了这个是网络链接的问题，需要翻墙

59.5169

3

0

0

关注作者

收藏

詹惠儿

机器学习预处理时教育程度是定量变量，为什么需要做哑变量处理呢

问：机器学习预处理时教育程度是定量变量，为什么需要做哑变量处理呢答：因为教育程度是有序型变量，有序型变量最好也进行哑变量处理，例如这里教育程度原本指的是‘博士’,'硕士'，'学士'，用有序数字表示为3,2,1，也就默认了三个类别是等间距且间距是1，无法准确表达数据的差异性。

55.2054

1

0

0

关注作者

收藏

詹惠儿

jupyter中如何恢复到改动前的内容？

问：如果我打开了一个jupyter，在里面添加了一些东西或者删除了一些东西，等我关闭这个文件的时候不想去保存它所做的一些修改，还想和刚开始打开一样，要怎么操作呢答：点击‘file’--‘revert to checkpoint’ 这里即可恢复到上一次保存时间。

55.2054

1

0

0

关注作者

收藏

詹惠儿

sns.scatterplot (date= tips, x= total_ bill" 1 y=“tip”)执行报错

问：为啥上面一条报错，下面一条就可以执行答：sns.scatterplot的参数data拼写错误，将其改为data即可。

55.2054

1

0

0

关注作者

收藏

詹惠儿

logistic模型中为什么把惩罚系数C设置成1/alpha?不是直接是alpha?

问：logistic模型中为什么把惩罚系数C设置成1/alpha?不是直接是alpha?答：alpha是正则项权重，添加正则项主要为了限制模型的学习能力，alpha越大，越能防止过拟合；参数C是对分类错误的惩罚程度，C越大，越不允许分类错误，越容易出现过拟合，因此alpha和C是成反比关系的。

55.2054

1

0

0

关注作者

收藏

詹惠儿

pip安装包报错：socket. timeout: The read operation timed out

问：pip安装包报错：socket. timeout: The read operation timed out答：这是由于下载速度慢而引起的超时错误，可通过在安装代码后添加国内镜像源解决此问题：pip install plotly -i https://pypi.tuna.tsinghua.edu.cn/simple

55.2054

1

0

0

关注作者

收藏

ermutuxia

如何借助python将一个文件夹下的excel文件，根据名字进行分类，将包含特定字符后缀的文件放到指定文件夹下？

比如现在有一个文件夹里的文件如下想把excel文件名字后缀（除了.xlsx部分外）以（6）结尾的名字放到一个指定的文件夹下，比如下面的文件夹下python中写如下代码#导入相关库import os, shutil#获取指定文件夹下面全部文件的名字,并返回一个列表filelist=os.listdir("D://源数据文件夹")#从上面的列表中筛选出符合条件的文件名字，比如名字后缀为(6)的,然后将

0.5698

2

1

0

关注作者

收藏

马锦涛

如何在爬虫处理异步加载数据？

对于异步加载数据来说，目前处理的方法主要有两种1、通过对异步加载数据的相关js包进行解析，得到相关数据2、利用模拟浏览器的方式进行解析，一般第二种的方法比第一种更加简单

0.0000

0

0

0

关注作者

收藏

马锦涛

什么是NoSQL？

NoSQL全称Not Only SQL，意即“不仅仅是SQL”，泛指非关系型数据库。传统的关系型数据库使用的是固定模式，并将数据分割到各个表中。然而，对大数据集来说，数据量太大使其难以存放在单一服务器中，此时就需要扩展到多个服务器中。不过，关系型数据库对这种扩展的支持并不够好，因为在查询多个表时，数据可能在不同的服务器中

0.0000

0

0

0

关注作者

收藏

马锦涛

scrapy中pipeline如何使用？

1、在Scrapy中，Item Pipeline是可选组件，默认关闭，要想激活它，只需在配置文件settings.py中启用被注释掉的代码即可。2、# Configure item pipelines# See https://doc.scrapy.org/en/latest/topics/item-pipeline.htmlITEM_PIPELINES = { 'qidian_hot.pip

0.0000

0

0

0

关注作者

收藏

<1…293031…39>

CDA考试动态

CDA报考指南