京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS分隔符格式数据文件的输入
分隔符格式文本文件的输入
我们使用Windows“记事本”创建一个显示如下格式的TEXT2.TXT的文件。
组中值,样本数,比例,累计次数,累计比例
0,7,5.56,7,15.56
1,3,6.67,10,22.22
2,8,7.78,18,40.00
3,7,5.56,25,55.56
4,7,5.56,32,71.11
5,4,8.89,36,80.00
6,2,4.44,38,84.44
7,3,6.67,41,91.11
8,3,6.67,44,97.78
该数据文件保存在配套光盘中(\SPSS\DATA\TEXT2.TXT)。
操作过程:
(1) 在主菜单中点击“File-Open-Data”命令,出现打开文件操作窗口。
(2) 在“查找范围”栏指定文本文件“TEXT2.TXT”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“Text2.txt”文件,再单击“打开”按钮。
(3) 出现数据引导对话窗口。
① 第一个对话窗口的设置
Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)
○ Yes 选择此项,则“Browse..”按钮被激活,可以将以前定义的文件调出。
⊙ No 不使用预先保存匹配的文本格式文件。
然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。
②第二个对话窗的设置
How are your variables arranged (变量间分隔方式?):
⊙Delimited: 变量间用特殊符号分隔,本例选中该项。
○Fixed width: 变量间为固定列宽度。
Are variable names included at top your file (文件顶端是否含变量名?)
⊙Yes: 文件中第1行为变量,本例选中该项。
○NO: 文件中没有变量名,系统自动给变量命名。
然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。
③第三个对话窗口的设置
The first case of data begins on which: 2 指定数据从哪一行开始,本例从第2行开始。
How are your cases represented 如何表达记录,有两种选择:
⊙Each line represents a: 每个记录占一行,本例选中该项;
○A specific number of variables represents: 多少个变量代表1个记录。
How many cases do you want to import 读入多少记录?
⊙All of the cases: 全部记录。系统默认,本例选中该项;
○The first 1000 cases: 开始的1000个记录;
○A random percentage of the cases (approximately): 随机选择一定百分比。
然后,点击下一步按钮。
④ 第四个对话窗口的设置
Which delimiters appear between variables: 变量间的分隔符号
□Tab: 制表符 □Space: 空格 Comma: 逗号,本例选中此项 □Semicolon: 分号 □Other: 自定义,将符号填入后面框里
What is the text qualifier? (字符串文本是用什么字符限制的?)
⊙ None 没有限制符,系统默认。
○ Single quote? 单引号。
○ Double quote? 双引号。
○ Other 其它字符。
⑤第五个对话窗口的设置
Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):
Variable name:?? 重新定义变量名称。
Data:? 重新定义变量的数据类型。
Original Name 原来的变量名称
观察数据读取情况,重新设置变量名和变量的数据类型。
⑥第六个对话窗口的设置
Would you like to save this file format for future?(是否将文件格式保存)
○ Yes 选此项,“Save as ..”按钮激活,单击按钮后,将文件另存到指定的路径。在有相同格式文本文件时调用
它来设置。
⊙ No 不保存
Would you like to paste the syntax?(是否存为程序语句文件?)
○ Yes 选中此项,则将上述过程保存为程序文件。
⊙ No 不保存为程序语句文件,系统默认。
设置完成后,在窗口的数据显示框里观察数据读取情况,如果读出的数据不对,可以点击“上一步”按钮,回到前面的对话窗口里进行修正设置。数据显示正确后,点击“下一步”按钮。最后单击“完成”按钮,文本数据就输入到数据编辑窗里。
比较两种文本格式文件的输入结果,发现定界符格式文件的输入比较方便操作,数据类型也好掌握,因此,我们在使用数据输入时尽量采用这种格式的文本文件。数据分析培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15