Python数据分析-数据科学专业问答社区-CDA答疑社区

热线电话：13121318867

登录

陈革007

Python 统计学习: corr相关系数的四种参数

根据实际情况, 将corr 里面的四种不同参数都试了一下虽然都是相关系数, 但实际情况有不同之处不填和 Pearson的结果是一样的 : 度量两变量X和Y之间相互关系（线性相关）spearson : 根据原始数据的排序位置进行求解kendall: 也是一种秩相关系数，不过它所计算的对象是分类变量。

31.1736

6

4

0

关注作者

收藏

M17051121193254

用Python统计推断——交叉表篇（上：crosstab与热图)

转载：https://zhuanlan.zhihu.com/p/52368125

18.8992

4

4

0

关注作者

收藏

shang9252

Python：sklearn数据预处理中fit(),transform()与fit_transform()的区别

1 概述注意这是数据预处理中的方法：Fit(): Method calculates the parameters μ and σ and saves them as internal objects.解释：简单来说，就是求得训练集X的均值啊，方差啊，最大值啊，最小值啊这些训练集X固有的属性。可以理解为一个训练过程Transform(): Method using these calc

18.6623

2

2

0

关注作者

收藏

陈革007

Python 数据清洗: Pandas crosstab()--顶级函数

今天在复习"Python统计学习"的时候,碰到这个 crosstab() 翻了翻之前数据清洗时候的课程笔记,介绍的都比较简单,所以,这里稍稍再扩展下这个顶级函数: pd.crosstab( index, #行索引 columns, #列索引 values=None, rownames=None, colnames=None, ag

18.8750

5

7

0

关注作者

收藏

Kevin66832

销售案例总结

1.非金字塔模型2.商机多考虑金额（计数没有用）3.多考虑几种维度的转化（转化过程）4.多找挖掘指标，现有的指标远远不够基准比，均比，标准比，差异百分比5.文本转化为数据，用来分析作为数据分析人员，要学会用数据分析，文本展示。

18.6385

1

4

0

关注作者

收藏

M17051121193254

pyecharts地图绘制

1.首先，为了地图上的数据能显示完全，先加载好需要的城市地理坐标数据。 pip install echarts-countries-pypkg 世界 pip install echarts-china-provinces-pypkg 中国-省份 pip install echarts-china-cities-pypkg 中国-城市 pip install echarts-ch

18.6385

1

6

0

关注作者

收藏

赵娜0418

用户画像分析的误区

1、限于数据，动不敢动。一提用户画像，很多人脑海里立刻蹦出了性别，年龄，地域，爱好等基础信息字段，然后大呼：我们好像没这个数据，于是放弃分析了。可实际想想，知道男性占比真的有那么大意义？知道男性占比65%还是60%真的对业务有帮助？不一定的，贴用户标签有很多方式，不要限于一些难采集的基础信息。2、罗列数据，没有思路。很多人一听到用户画像分析，本能的就开始把数据库里的用户标签往外搬，在报告里码上

44.2068

9

3

0

关注作者

收藏

赵娜0418

使用Excel和使用Python绘图的不同

因为Excel画出来的图能够交互，能够在图上进行一些简单操作，所以这里用的python的可视化库是plotly，案例大家根据自己的需求导入自己的案例数据，开始之前，首先加载plotly包。柱状图下面是用Excel画的柱状图下面用plotly来画一下雷达图用Excel画的：用python画的：画起来比Excel要麻烦得多。总体而言，如果

20.4458

6

2

0

关注作者

收藏

陈革007

案例: python 词云图制作#mojito

爬虫 jieba 正则 wordcloud抓住周总新歌的热度,来一波图表制作1.爬取某音乐平台的评论, 25000条,但是电脑配置有限, 运行的结果中只有 1800条 2.jieba库分词正则, 清除不必要的字段3.wordcloud 绘制需要相关代码的私

42.7406

15

5

0

关注作者

收藏

yuechuchen

np.random.seed()的作是什么？

np.random.seed()用来指定随机数种子，固定了随机数种子即选定了随机数的生成方式，保证每次生成的随机数都是同一批数，不同电脑上用相同的随机数种子也可以生成相同的数据，需要注意的是，随机数种子需要与随机数生成函数同时运行，不能分开运行。

20.1335

1

4

0

关注作者

收藏

yuechuchen

数据进行拼接的时候，axis参数的设置，有时候选择1和-1的结果一样，这是什么原因？

对于数组来说，如果指定轴信息为-1表示选取的是最内侧的轴，如果目标数组的维度是二维，那么指定轴信息为1或者-1都是指按照两个轴中的内侧轴进行操作，索引结果也会是一样的。

0.0000

0

2

0

关注作者

收藏

M17051121193254

一般线性模型

一般线性模型:

16.4681

2

4

0

关注作者

收藏

大魔王泛泛

在Anaconda里如何安装xgboost

打开 Anaconda prompt执行：conda install -c anaconda py-xgboost验证是否安装成功：我们看到了xgboost的版本号证明安装成功

16.7576

7

1

0

关注作者

收藏

liting李

matplotlib怎么在每条曲线上添加文本标签？

像这样黄色的线怎么在每条线加上文字标签呢？代码如下： plt.legend(loc="best") 代码放到最后，放到for循环外面，但是加上之后不显示，是因为加不进去了，线太多，没有地方放了。

16.4702

3

1

0

关注作者

收藏

陈革007

数据可视化: Matplotlib 绘图出现乱码情况可以试试这种操作

11.8032

5

5

0

关注作者

收藏

大魔王泛泛

ExceptionE Jupyter comnand‘ jupyter-contrib' not found

出现这个错误是因为我们没有安装 jupyter-contrib在命令行中执行 pip install jupyter_contrib_nbextensions 即可安装jupyter-contrib

11.6059

3

2

0

关注作者

收藏

xmd11

SQL相关子查询与非相关子查询

SQL相关子查询与非相关子查询https://blog.csdn.net/shiyong1949/article/details/80923083

27.2717

3

4

0

关注作者

收藏

pkwwwsas

图形选择决策树

如何选择正确的图标以及图标分类：

11.6059

3

3

0

关注作者

收藏

xmd11

SQL中的ON和WHERE的区别

SQL中的ON和WHERE的区别https://blog.csdn.net/liitdar/article/details/80817957

0.0095

1

0

0

关注作者

收藏

慢慢爬的Rui

标准化的方法

(一) 为什么要进行标准化把特征的各个维度标准化到特定的区间把有量纲表达式变为无量纲表达式(二)标准化常用方法1. standard scaler : 需满足数据为正太分布 (x- mean(x))/std(x)2. MinmaxScaler : 将数据变换到要求的范围 (b-a) * (x-min)/(max-min) * a3. RobustScaler: 在数据分

27.2622

2

3

0

关注作者

收藏

<123…123>

CDA考试动态

CDA报考指南