这五十位人物,推动中国进入大数据时代| 重磅榜单 近年,国务院通过《大数据发展纲要》,TalkingData、九次方、百分点等大数据公司完成数亿元融资,首家大数据交易所落户贵阳。这些无不清楚而明白地告诉我们, ...
2017-12-12CDA&中国电信四川分公司CDA level 1课程及认证考试内训圆满成功 2017年10月下旬,CDA数据分析研究院在中国电信四川分公司进行了CDA level 1课程及认证考试内训。老师和数据分析部门的相关同事进行积极地交流 ...
2017-11-07SPSS最优尺度:分类主成分分析 一、分类主成分分析(分析-降维-最优尺度) 1、概念:此过程在减少数据维数的同时量化分类变量。分类主成份分析也表示为缩写词CATPCA(代表categorical principal co ...
2017-11-05SPSS缺失值:缺失值分析 一、缺失值: 具有缺失值的个案会引发严重的问题,因为典型的建模过程会简单地从分析中丢弃这些个案。如果存在少量缺失值(大约低于个案总数的5%),且这些值可以被认为随 ...
2017-11-02医疗行业大数据应用的三个案例 文章从华大基因推出肿瘤基因检测服务、大数据预测早产儿病情、广东省人民医院利用大数据调配床位3个医疗行业大数据应用案例中,以应用背景、数据源、图说场景、实现途径、应用效 ...
2017-11-02信度分析的原理与SPSS操作 一、什么是信度? 信度是指根据测验工具(量表)所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。一般而言,两次或两个测验的结果愈是一致,则误差愈小,所得的信度 ...
2017-10-14SPSS超详细操作:分层回归(hierarchical multiple regression) 1、问题与数据 最大携氧能力(maximal aerobic capacity, VO2max)是评价人体健康的关键指标,但因测量方法复杂,不易实现。某研究者拟通过一些 ...
2017-09-25SPSS统计分析:多因素方差分析及案例 多因素方差分析,用于研究一个因变量是否受到多个自变量(也称为因素)的影响,它检验多个因素取值水平的不同组合之间,因变量的均值之间是否存在显著的差异。多因素方差分 ...
2017-09-22倒计时100天 ▏CDA LEVEL 1假设检验+方差分析_备考习题详解 《CDA LEVEL 1假设检验+方差分析_备考习题详解》 主讲人: 傅老师 官方建议 CDA LEVEL 1备考需要1--3个月时间,在备考的过程中主要根据考试大纲中 ...
2017-09-21SPSS统计分析案例:无空白列重复正交试验设计方差分析 前面有讲过 SPSS正交试验设计及其方差分析一篇文章,包含了一个典型的正交试验案例。然而在实际应用当中,主观客观条件复杂多变,在试验设计中就要求能够 ...
2017-09-18SPSS正交试验设计及其方差分析 试验优化设计,指在最优化思想的指导下,进行最优设计的一种优化方法,从不同的优良性出发,合理设计试验方案,有效控制试验干扰,科学处理试验数据,全面进行优化分析,直接实 ...
2017-09-18SPSS科研统计:数据的排序、拆分与合并 通常在进行统计分析之前,可能要对数据文件进行基本的处理操作,让数据格式更加适合用于将要用到的统计分析方法。数据文件的基本操作主要包括数据的排序、数据的分组、 ...
2017-09-11CDA考试 ▏2017 CDA L1备考资源习题详解-统计基础部分 《CDA LEVEL 1描述性分析典型例题讲解》 主讲人:CDA命题组委会 傅老师 官方建议 CDA LEVEL 1备考需要4-6个月时间,在备考的过程中主要根 ...
2017-09-08SPSS识别并删除重复个案的两种方法 SPSS怎么识别并删除重复个案?在一些测验统计结果中,经常会出现重复个案,即用户名、选项完全相同的个案,如果不作处理,显然会影响统计结果。因此,接下来介绍两种识别并 ...
2017-07-28多元回归分析F检验显著,但各个自变量都不显著 在用SPSS进行多元回归分析时,Anova的F值结果显著,但回归系数表中所有变量却都不显著,为什么呢?具体问题如下: 我的方程有三个预测变量。ANOVA分析的结果 ...
2017-07-14Excel隐藏多行,如何一次全部展开显示或取消隐藏 在Excel的数据录入或者其他数据处理操作中,有时候为了显示方便,会把一些行或列隐藏起来,例如下图原始数据,目标是将第6~第20行隐藏起来。 图1 ...
2017-07-14因子分析中根据因子载荷大小删除题目的标准 我们在做因子分析(包括探索性因子分析EFA和验证性因子分析)时,经常会发现有些指标的因子载荷比较低,例如低于0.5,那么这样的题目是否应该删除呢?根据因子载荷 ...
2017-07-14SPSS变量值标签的批量设置、复制、显示及删除问题 在SPSS的变量设置中,值标签是对变量可能取值的注释说明。当我们需要给很多个变量设置相同的值标签时,该如何操作?例如,在很多调查问卷中,采用里克特量表 ...
2017-07-14SPSS操作:轻松实现1:1倾向性评分匹配(PSM) 谈起临床研究,如何设立一个靠谱的对照,有时候成为整个研究成败的关键。对照设立的一个非常重要的原则就是可比性,简单说就是对照组除了研究因素外,其他的因素应该 ...
2017-07-12SPSS分析技术:典型判别分析;由鸢(yuan)尾花分类发展而来的分析方法 前面介绍的因子分析和聚类分析都是围绕变量进行的分析,这里的变量不分因变量和自变量。因子分析通过变量结构的研究,达到降低维度的目的 ...
2017-07-11在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28