热线电话：13121318867

Excel中的高级数据分析(1)

2016-01-01

Excel中的高级数据分析(1)

网站分析中专业的工具除了Google Analytics, Adobe Sitecatalyst, Webtrends, 腾讯分析和百度统计等外，我想最常用的数据处理工具就是Excel了，Excel里头最基础的就是运算和图表的制作，稍微高级一点就是函数和数据透视表的使用了，当然你可能还会想到VBA和宏，但估计很少高手会使用这些高级的功能。

那对于高级的数据分析而言，也就是涉及统计学的专业分析方法和原理的时候，是不是就一定得求助SPSS,SAS这类专业的分析工具呢？数据分析从低级到高级层次的跳跃过程中有没有可以起承接作用的工具呢？其实是有的，这就是Excel的数据分析功能。貌似最近比较火的两本Excel书籍《谁说菜鸟不会数据分析》和《让Excel飞》都没有涉及这部分的内容。高级的数据分析会涉及回归分析、方差分析和T检验等方法，不要看这些内容貌似跟日常工作毫无关系，其实往高处走，MBA的课程也是包含这些内容的，所以早学晚学都得学，干脆就提前了解吧，请查看以下内容。

在使用之前，首先得安装Excel的数据分析功能，默认情况下，Excel是没有安装这个扩展功能的，安装如下所示：
1）鼠标悬浮在Office按钮上，然后点击【Excel选项】：

2）找到【加载项】，在管理板块选择【Excel加载项】,然后点击【转到】：

3）选择【分析工具库】，点击【确定】：

4）安装完后，就可以【数据】板块看到【数据分析】功能，如下所示：

一、回归分析

在详细进行回归分析之前，首先要理解什么叫回归？实际上，回归这种现象最早由英国生物统计学家高尔顿在研究父母亲和子女的遗传特性时所发现的一种有趣的现象：身高这种遗传特性表现出”高个子父母，其后代身高也高于平均身高；但不见得比其父母更高，到一定程度后会往平均身高方向发生’回归’”。这种效应被称为”趋中回归”。现在的回归分析则多半指源于高尔顿工作的那样一整套建立变量间的数量关系模型的方法和程序。这里的自变量是父母的身高，因变量是子女的身高。
百度百科对于回归分析的定义是: 回归分析（regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛：
1）回归分析按照涉及的自变量的多少，可分为一元回归分析和多元回归分析；
2）按照自变量和因变量之间的关系类型，可分为线性回归分析和非线性回归分析。

这里举个电商的例子：电子商务的转换率是一定的，网站访问数一般正比对应于销售收入，现在要建立不同访问数情况下对应销售的标准曲线，用来预测搞活动时的销售收入，如下所示：

1. 首先，利用散点图描绘图形：

2. 添加趋势线，并且显示回归分析的公式和R平方值：