一种特定类型的流程图,始末端的分支宽度总各相等,一个数据从始至终的流程很清晰,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。
读童话的狼
2020-02-22
柱状图利用柱子的高度,反映数据的差异。肉眼对高度差异很敏感,辨识效果非常好。柱状图的局限在于只适用中小规模的数据集。 通常来说,柱状图的X轴是时间维,用户习惯性认为存在时间趋势。如果遇到X轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注。
读童话的狼
2020-02-22
在进行对比分析时,由于饼图是按扇形面积进行比较,当面积区别不明显时,很难区分出来,另外饼图只能显示百分比,不能显示更加精细的结果。 而使用条形图后,由于人眼对高度更加敏感,可以很容易的进行比较,也能知道各子类别数量。 所以的进行数据可视化分析时,我们通常应该用条形图来替代饼图,以提高图表的可读性。
读童话的狼
2020-02-22
通常来说,两个变量时选择散点图(如:身高、体重),三个变量时选用气泡图(如:身高、体重、年龄)、多个变量时选用雷达图,但雷达图一般也不出超过6维
读童话的狼
2020-02-21
是不可以的,BI仪表板可以导出为PDF,若要插入word里面,只能采取截图的方式 如果想要动态展示只能先把bi文件发布到web在线服务,在利用链接插入到文件中
读童话的狼
2020-02-21
1、打开开始菜单,一般软件名字后边会跟有版本号,如:IBM SPSS Statistics 25 2、打开软件时会有提示,如下图: 3、打开软件内的帮助选项卡,点击关于,就可以显示版本号
读童话的狼
2020-02-21
在统计学中,非常容易把这个概念模糊化,很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。但是这里有两个容易混淆的地方 1.真值只得是样本参数还是总体参数? 这个问题的答案是总体参数,我们取的数据是样本数据,点估计是样本参数的真实值,我们要估计总体参数。 2.变动的是谁? 总体真值只有一个,它要么落在这个范围,要么不落在这个范围,并不涉及概率,每次抽样变动的是置信区间。也就是多
读童话的狼
2020-02-21
参数估计中,用来估计总体参数的统计量称为估计量,样本均值,样本比例,样本方差都可以是一个估计量; 根据一个具体样本计算出的估计量的值叫做估计值。
读童话的狼
2020-02-21
表准得分又称为标准分:变量值与其平均数的离差除以标准差 若某个数值的标准分数为-1.5,该数值低于平均数1.5倍标准差 数据标准化就是一个均值为零方差归一的过程
读童话的狼
2020-02-21
统计学可以分为两块内容:描述统计和统计推断。 描述统计使用一些指标如均值、标准差对数据集合进行总结性描述; 而统计推断从数据当中得出关于随机变量的结论,是对随机现象的分析,它的基础是概率论。
读童话的狼
2020-02-21
数学期望常称为“均值”,即“随机变量取值的平均值”之意,当然这个平均,是指以概率为权的加权平均。数学期望是由随机变量的分布完全决定。 所以期望不是均值 那么两者又有什么联系呢? 大数定理说明了当样本量N趋近无穷大的时候,样本的平均值无限接近数学期望。
读童话的狼
2020-02-21
就是那个用 cmd 启动 Jupyter Notebook 时,一打开的那个页面,其实是一 个文件夹的文件目录,想要修改默认工作目录,按照方法。 打开 Windows 的 cmd,在 cmd 中输入 jupyter notebook --generate-config 1. 可以看到 jupyter_notebook_config.py 文件路径 2. 按照这个路径, 找到 jupyter_not
读童话的狼
2020-02-20
使用pip安装安装python库的时候是比较慢的,可以选择利用清华镜像 安装单个库,在安装代码后添加-i https://pypi.tuna.tsinghua.edu.cn/simple pip install xxx -i https://pypi.tuna.tsinghua.edu.cn/simple
读童话的狼
2020-02-20
下载 可以从https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost下载对应的版本,cp36对应python3.6,cp37对应python3.7版本 安装 打开Anaconda3的安装位置如:D:\ProgramData\Anaconda3 将xgboost-0.90-cp36-cp36m-win_amd64.whl放入到文件夹中 在该文件夹中空白
读童话的狼
2020-02-20
M函数获取网页数据时不能获取完整数据,变换参数无法查询出数据,或提示超时 如果函数书写没有问题,就需要不断刷新,因为获取的是网页数据,与网页解析情况,网速,同时访问人数都有关系
读童话的狼
2020-02-20
EXCLE中四分位数的计算公式如下: Excel中获取分位数的函数为QUARTILE(array,quart),其中array为要求分位数的数列,quart取值为{0,1,2,3,4},分别对应最小值,上四分位数,中位数,下四分位数,最大值。
读童话的狼
2020-02-20