首页 > 行业图谱 >

- R语言之随机数与抽样模拟篇
2018-03-12
-
R语言之随机数与抽样模拟篇
R语言生成均匀分布随机数的函数是runif()
句法是:runif(n,min=0,max=1) n表示生成的随机数数量,min表示均匀分布的下限,max表示均匀分布的上限;若省略参数mi ...

- 使用R对共线性检验
2018-03-11
-
使用R对共线性检验
高维数据常会出现共线性
、变量选择等问题 。如何消除共线性确定最佳模型,是回归分析的一个重点。 传统的最小二乘估计在处理多重共线性问题上 往往有令人不太满意的地方,
主要有两点: ...

- Python 爬取淘宝商品数据挖掘分析实战
2018-03-03
-
Python 爬取淘宝商品数据挖掘分析实战
项目内容
本案例选择>> 商品类目:沙发;
数量:共100页 4400个商品;
筛选条件:天猫、销量从高到低、价格500元以上。
项目目的
1. 对商 ...

- SPSS之偏态分布的激素水平影响因素分析
2018-03-03
-
SPSS之偏态分布的激素水平影响因素分析
概况:某种激素水平对胃癌的发生有一定的作用,把病人分为实验组和对照组。
性别:男、女。
年龄:青年(<45岁)、中年(45岁~59岁)、 ...

- R描述性统计分析
2018-02-27
-
R描述性统计分析
概念
数据摘要,有损地提取数据特征的过程,包含基本统计,分布/累计统计,数据特征(相关性,周期性等),数据挖掘
数据有很多变量和观测值,可以用一些简单表格,图形和少数汇总数字 ...

- 使用Python进行描述性统计
2018-02-26
-
使用Python进行描述性统计
1 描述性统计是什么?
描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,我们可借助描述性统计来描绘或总结数据的基本情况,一来可以梳 ...

- 用python-pandas作图矩阵
2018-02-24
-
用python-pandas作图矩阵
我们在采用机器学习算法对数据进行分析时,首先要对数据进行了解,而了解数据最快速的方式就是可视化。但是作者可视化采用的方法对很多data都通用,且采用的是各种图形的图矩阵,如直 ...

- 数据探索和数据准备的步骤
2018-02-22
-
数据探索和数据准备的步骤
如我们所知,数据分析工作的70%的时间都用作于数据清洗,数据探索和数据准备当中,这可以说是数据分析的核心所在。数据清洗主要是工具层面上的,这里先不讨论。我们这里讨论数据探索 ...

- R语言学习笔记之聚类分析
2018-02-15
-
R语言学习笔记之聚类分析
使用k-means聚类所需的包:
factoextra
cluster #加载包
library(factoextra)
library(cluster)l
#数据准备
使用内置的R数据集USArrests
...

- 数据分析|微信红包金额分配的秘密
2018-02-14
-
数据分析|微信红包金额分配的秘密
“微信红包”是腾讯公司开发的社交软件——微信的一个附加功能。它可以在一对一聊天当中发送,也可以在群聊中发送。在群聊当中,可以一次性发送多于1个的红包,每个群成员可 ...

- 上市公司财务指标综合分析
2021-03-08
-
一、案例综述
案例编号:
101003
案例名称:
财务管理领域的应用——上市公司财务指标综合分析
作者姓名(或单位、或来源):
刘莎莎
案例所属行业:
69 证券
案例所用软件:
...

- R语言使用密度聚类笔法处理数据
2018-01-18
-
R语言使用密度聚类笔法处理数据
说明
除了使用距离作为聚类指标,还可以使用密度指标来对数据进行聚类处理,将分布稠密的样本与分布稀疏的样本分离开。DBSCAN是最著名的密度聚类算法。
操作
将使用mlb ...

- R语言线性回归诊断
2018-01-15
-
R语言线性回归诊断
回归诊断主要内容
(1).误差项是否满足独立性,等方差性与正态
(2).选择线性模型是否合适
(3).是否存在异常样本
(4).回归分析是否对某个样本的依赖过重,也就是模型是否具有稳定性
(5).自变量 ...

- R语言中qplot()的用法
2018-01-15
-
R语言中qplot()的用法
a, b, c, d, e, f, g, h = range(8)
ggplot2()函数
ggplot2是一个强大的作图工具,它可以让你不受现有图形类型的限制,创造出任何有助于解决你所遇到问题的图形。
qplot()
qplot()属于gg ...

- R语言回归分析之影响分析
2018-01-14
-
R语言回归分析之影响分析
说明
影响分析就是探查对估计有异常影响的数据,如果一个样本不遵从某个模型,但是其余数据遵从这个模型,称为这个样本点为强影响点,也称为高杠杆点,影响分析的一个重要功能就是 ...

- R语言与回归分析几个假设的检验
2018-01-14
-
R语言与回归分析几个假设的检验
一、从线性回归的假设说起
对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫条 ...

- 避开十大误区,别做渣渣图表
2018-01-03
-
避开十大误区,别做渣渣图表
设计师要做的,不仅仅是选择合适的图表类型,更要以一种容易理解的方式来呈现信息,设计出更直观的导航系统,让观众做尽可能减少理解方面的麻烦,做到一目了然。
大数据魔镜 ...

- 大数据在企业运营中可落地的八大应用
2017-12-30
-
大数据在企业运营中可落地的八大应用
由于任何问题都有可能在某种程度得到优化,问题在于,大数据在企业运营中到底有哪些应用值得我们关注?
无论规模大小,无论是生产型还是服务型,无论是盈利还是非盈利 ...

- 用SPSS做数据分析?先弄懂SPSS的基础知识
2022-01-20
-
易用性强:操作界面极为友好,操作简单
为高级用户提高编程能力
&nbs ...

- 网站用户行为分析案例
2021-03-08
-
一、案例综述
案例编号:101001
案例名称:互联网行业——网站用户行为分析
作者姓名(或单位、或来源):刘莎莎
案例所属行业:G6020 互联网信息
案例所用软件:
MYSQL、 Sas EG、 TOA ...