
用excel完全可以代替SPSS软件
市场研究界习惯使用SPSS软件进行统计计算与分析,大家都说效果非常不错。当年刚刚创业时,我们也慕名准备使用该软件。到同行处去看了一下,不仅英文多,而且与Window不兼容(当时是这样),对于我们这些离不开微软程序的人来说,这样的学习成本太高了。后来,深入研究了一下excel程序,发现微软实在是优秀的软件公司,使用excel程序完全可以替代SPSS程序。
一、 excel中的统计函数
除了轻而易举的四则运算之外,在excel中有专门的统计函数栏目(点击插入-函数-统计),包括∶中位数(MEDIAN)、众数(MODE)、方差(DEVSQ)、标准差(STDEV)、频率(FREQUENCY)、置信区间(CONFIDENCE)、最大值(MAX)、最小值(MIN)等等,看一看帮助说明操作起来很容易。
如果一下找不到想要的函数,也不难,可以根据公式让excel计算。我不喜欢记公式,就去查一下书,然后把常用的一些统计公式做到excel某个文件中。比如,为计算应调查的样本数量,做出下表∶
1、重复抽样
概率度t
标准差σ
极限误差△
样本总数N
样本数n
B3
C3
=B3^2*C3^2/D3^2
2、不重复抽样
概率度t
标准差σ
极限误差△
样本总数N
样本数n
B5
C5
D5
E5
F5
=E5*B5^2*D5^2/(E5*D5^2+B5^2*D5^2)
等等。上表中B3、C3等符号是为了说明空格的位置才加上去了,在excel中看不到,在相应的位置输入实际的数据结果就会自动算出来。当然,用vb的frame控件来编个程序也可以,但好像太浪费大脑与电脑资源了,这样的函数已经足够解决我们的问题。其它很多统计计算用函数也可同样处理。
二、 统计数据分析
1、分析工具库加载宏
SPSS中的回归分析,在excel“工具”中也用(见本人的博客“利用excel提高工作效率”),用数组公式也可以,步骤如下∶
A. 选定数组公式输入区域
B. 输入公式
C. 按ctrl+shift+enter完成
2、聚类分析等
充分利用excel中的“筛选”、“排序”即可,在“数据”菜单中,具体操作方法请看“帮助”。在excel中做交叉分析时,可以使用“筛选”,数据的个数数字会显示在excel文件的下方。当然,如果要做大量的交叉分析,这样的办法还是很不方便的,不够自动化,很多数字要靠手工记录,这个时候,就要辛苦一些,用vb语言做一下程序了(不要怕,vb语言就是为非专业人士准备的程序语言,操作思路见本人的博客“利用excel提高工作效率”。
3、各种统计检验
在excel中,还有成对双样本均值分析、t检验:双样本等方差假设、F检验:双样本方差分析等,能够大大提高统计结论的科学性。
三、 用宏语言安排统计工作
在SPSS中,使用者没有什么自由度,完全受到人家事先编好程序的控制,遇到一些临时出现需要特别处理的问题十分被动,不妨尝试一下在Window中用vb语言编一些程序吧。我做交叉分析就用了vb语言,就是用循环句(for)而已,让统计结果自动汇总显示在数据库的某一处。当然,为了提高程序的运行速度,建议尽量利用Window本身已有的功能。比如,我会让程序先对数据库进行排序,然后利用Window已有的“筛选”功能提高计算的速度,这样,运行效率提高了很多。即使不懂这些所谓的技巧也没有关系,大不了让电脑累一些就是了,你自己可以放松一下,多一些伸懒腰的时间。
数据库的汇总统计用countif函数也可以,但太笨,如果你经常做统计工作,建议将工作“录制宏”,并进行一些改编,这样,一点击鼠标,数据的统计结果就自动出来了。这还不够,我还让excel根据统计结果自动作图,自动将统计数据库及图标拷贝到Word中(因为我们总是在Word中写分析报告)。
我们的问卷一般都录入在Word文件中,我们设置的excel数据统计程序显示的选项都是数字,没有把汉字选择项表示出来。一开始,我们都是从Word中一点一点把文字拷进excel表格中的相应位置,后来,我觉得如果已经在电脑中输入过一次,就不应该为此做第二次的手工工作,就编了一个小程序,Word中的汉字就可以直接自动拷贝到excel中来了,省了很多手工劳动。
四、 其它,象制图之类的工作,excel也相当出色,没有必要劳驾SPSS。
总之,Office实在是太强了,在电脑办公方面有绝对的垄断性,好好用它,就可以不理睬许多其它的电脑软件,大大提高我们的工作效率,降低自己的学习与时间成本。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29