数据科学专业问答社区，好文章，一字千金--CDA答疑社区

热线电话：13121318867

登录

PGC123

ODS与EDW的区别是啥呢？

ODS EDW1.使用人员的不同 ODS主要面向营业、渠道等一线生产人员和一线管理人员，为了实现准实时、跨系统的运营细节数据的查询，以获得细粒度的运营数据展现。ODS是可变数据，可以进行增删查改，是介于DB与DW的一种数据存储形态，目的是为了数据仓库的处理和决策系统要求与OLTP系统相隔离，减少决策系统对OLTP系统的性能影响。 EDW主要面向专业分析人员、辅助决策支持人员等，为了实现基于历

0.0000

0

1

0

关注作者

收藏

阿抽哥哥

Python爬虫 headers出错

报错代码：import requestsurl = "https://movie.douban.com/top250" headers = {'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}res = request

0.0000

0

0

0

关注作者

收藏

詹惠儿

R语言报错备忘单

RStudio终端中的错误显示为红色。以下是一些最常见的错误以及如何解决这些错误：1. Error: object 'foo' not found （foo任何名字在哪里）。您试图访问不存在的变量。你可能有拼写错误的变量名称错误地将变量名称大写（R区分大小写！）忘记在第一个位置运行定义变量的行，或者在该行上遇到错误。2. Error: could not find function

0.0000

0

3

0

关注作者

收藏

阿抽哥哥

Python条件控制语句if...elif...else错误

问：简单的python程序报错，改了半天也不知道哪里错了play = input("请输入剪刀(0)石头(1)布(2)：")player = int(play)com = 1if (player==0 and com==2) or (player==1 and com==0) or (player==2 and com==1): print("你赢了，真厉害")elif

85.7143

1

1

0

关注作者

收藏

wangjuju123

更改数据框索引列

一问题描述：在导入数据之后，如何更改索引列1.正常导入数据 2.输入命令 df.reset_index(drop=True),可以将原有错误的索引列删除的同时赋一个新的索引列。

50.6030

2

2

0

关注作者

收藏

wangjuju123

如何改变DataFrame数据的索引列？

一、问题描述有学员在导入数据时发现他自己的数据索引列值都为空，如下：我们想要把索引列换成一般的序列，可进行如下操作：

0.0000

0

0

0

关注作者

收藏

詹惠儿

怎么高效率地阅读R的报错信息

怎么高效率地阅读R的报错信息如果您的代码出现问题，R会告诉您。如果你不熟悉它们，这些错误信息的范围可以从轻微混乱到完全不可理解。当您熟悉R中的错误和警告消息时，您可以快速判断出错了什么。错误可能以两种方式发生：代码一直运行到最后，代码完成后，R会打印出一条警告消息。代码立即停止，因为R无法执行，R打印出错误消息。阅读错误消息我们来看看这样的错误消息。如果您尝试以下代码，您会得到或多

0.0000

0

3

0

关注作者

收藏

阿抽哥哥

Python学习中zip迭代器转换list问题

问题：这里为什么只迭代一次，但是将zip对象z转换为list就可以正常迭代？答：zip() 返回的是一个对象，对象z是一个迭代器，当python解释器执行到len(list(z))的时候，已经将z内的数据全部遍历一次，这个时候，z已经空了，下一次for循环，对象z空了，len(list(z))为0，且对象z读不出来任何数据。对于同一个迭代器（例如代码中的z），只能遍历一次，然后迭代器就

43.7056

1

5

0

关注作者

收藏

詹惠儿

简述什么是回归

回归的定义：当存在显着的线性相关时，可以使用线来估计自变量的某些值的因变量的值。回归方程的适用范围：当存在显着的线性相关性时。也就是说，当你在相关假设检验中拒绝rho = 0的零假设时。在估计中使用的自变量的值接近原始值。也就是说，当x为200时，你不应该使用在10和20之间使用x得到的回归方程来估计y。回归方程不应与不同的人群一起使用。也就是说，如果x是男性的身高，而y是男性的体重，那

0.0000

0

2

0

关注作者

收藏

PGC123

系统变量添加chromdriver失败

在学习爬虫的时候向系统环境变量添加chromdriver失败，添加后的变量如下图所示; 向环境变量添加的应该是软件位置的一个文件夹路径而不是具体文件的路径，这里需要把chromedriver从路径中去掉。去掉之后就可以了

30.2529

1

3

0

关注作者

收藏

詹惠儿

正态分布与标准正态分布的区别

正态分布钟形关于均值对称连续曲线下的总面积为1.00大约68％位于平均值的1个标准偏差内，95％位于2个标准偏差内，99.7％位于平均值的3个标准偏差内。这是前面提到的经验规则。由x表示的数据值具有平均μ和标准偏差sigma。概率函数 a标准正态分布平均值为0方差为1标准差为1由z表示数据值。概率函数 a

6.8974

1

0

0

关注作者

收藏

阿抽哥哥

Python中列表之间如何比较大小？

列表直接进行比较这个大小是依据什么判断的呢？从第一位开始比较，并且按照同位置进行比较，如果对应位置没有数则默认为0。

0.0000

0

3

0

关注作者

收藏

PGC123

解析json数据的时候

我解析json时,写的一个代码,怎么老提示这个错误 ?该怎么改 ? 首先要确定json.loads()解析函数的参数是什么，从报错信息来看是传入的参数有问题，看看传入的字符串是否是json数据格式，如果不是需要处理好之后再解析。

0.0000

0

2

0

关注作者

收藏

PGC123

pip安装selenum报错

pip 安装selenum 时报错，错误如下：这个提示说明依赖关系中缺少了PyHamcrest模块，但是并没有安装，因此解决办法也很简单，通过pip安装一下即可pip install PyHamcrest

0.0000

0

2

0

关注作者

收藏

阿抽哥哥

Python爬虫抓取网页信息的响应状态有哪些？

如果某项请求发送到服务器端要求显示网站上的某个网页（例如，用户通过浏览器访问的网页时），服务器将会返回 HTTP 状态代码以响应请求。例如下图所示：访问了“www.baidu.com”，返回了200与307状态代码。我们最常见的便是404，次网页不存在。那这些代码是什么意思？还有哪些状态代码呢？1xx：表示临时响应并需要请求者继续执行操作的状态代码。2xx：表示服务器成功处理了请求

43.7056

1

0

0

关注作者

收藏

阿抽哥哥

jupyter如何设置同cell单元内输出所有返回值

jupyter notebook的cell单元格如果不做设置，同一个cell单元只会输出最后面有返回值的代码，不能做到有返回值的代码进行输出。解决的办法是：打开jupyter notebook后在cell单元内输入下列代码#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.as

0.0000

0

3

0

关注作者

收藏

啊啊啊啊啊吖

Rstudio里的快捷键

console：将光标定位到控制台 Ctrl 2 Ctrl 2 清空控制台 Ctrl L Command L 将光标定位到行首 Home Command Left 将光标定位到行末 End Command Right 在历史命令中导航 Up/Down Up/Down 弹出历史命令框 Ctrl Up Command Up 中断当前命令的执行

43.7056

1

3

0

关注作者

收藏

PGC123

谷歌chromdirver使用报错

在做爬虫的时候，使用selenume的webdriver时出现如下报错：这是因为‘chromedriver’的路径没有加入到系统环境变量的原因，因此将chromedriver的路径放入环境变量即可。

30.2529

1

3

0

关注作者

收藏

啊啊啊啊啊吖

【问题求助】R里内存问题

0.0000

0

1

0

关注作者

收藏

啊啊啊啊啊吖

关于统计套利里的问题

最近在做一个统计套利，mspread 一个序列，> if(mspread[t-1,1] < 0

0.0000

0

2

0

关注作者

收藏

<1…116211631164…1217>

CDA考试动态

CDA报考指南