cda

数字化人才认证

首页 > 行业图谱 >

【CDA干货】金融统计实战案例:银行个人信贷违约预测的统计分析与风险应用

【CDA干货】金融统计实战案例:银行个人信贷违约预测的统计分析与风险应用
2025-11-11
金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的收益波动分析,再到监管合规的数据报送,统计方法是金融机构控制风险、提升收益的核心 ...

【CDA干货】mtcars 数据集的实战

【CDA干货】mtcars 数据集的实战
2025-11-11
这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是:以 mtcars 数据集的 “每加仑里程(mpg)” 为因变量,“气缸数(cyl)、马力(hp) ...

【CDA干货】大模型每层神经元个数怎么定?从原理到实操的完整指南

【CDA干货】大模型每层神经元个数怎么定?从原理到实操的完整指南
2025-11-10
在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少会导致 “欠拟合”(模型容量不足,无法捕捉复杂规律),个数过多则会引发 “过拟合” ...

【CDA干货】购买决策推动力分析

【CDA干货】购买决策推动力分析
2025-11-10
形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗”“别人怎么看”“买起来麻烦吗” 四个维度,层层递进影响消费决策,共同构成从需求 ...

【CDA干货】用模型挖掘数据中的隐性特征:方法、案例与落地指南

【CDA干货】用模型挖掘数据中的隐性特征:方法、案例与落地指南
2025-11-07
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “隐性特征”—— 它们隐藏在数据关联、行为模式或语义背后,比如 “用户潜在消费偏好” ...

【CDA干货】大模型结果稳定性方法论:从输入到落地的全流程管控

【CDA干货】大模型结果稳定性方法论:从输入到落地的全流程管控
2025-11-07
在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一致答案;对数据分析而言,同类查询需返回可复用结果;对代码生成而言,相似需求需输出 ...

【CDA干货】机器学习分类模型:从原理到实战的完整指南

【CDA干货】机器学习分类模型:从原理到实战的完整指南
2025-11-06
在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 / 恶性)”,从 “客户流失预测(流失 / 留存)” 到 “图像分类(猫 / 狗 / 汽车)” ...

【CDA干货】卡方检验 P 值与 OR 值:从关联判断到强度量化的互补逻辑

【CDA干货】卡方检验 P 值与 OR 值:从关联判断到强度量化的互补逻辑
2025-11-05
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是两个高频但易混淆的指标:有人误将 “P 值小” 等同于 “关联强度大”,也有人忽略 P ...

电子版《CDA教材》(一级)获取入口

电子版《CDA教材》(一级)获取入口
2025-11-05
教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键的 “纲” 与 “本 ...

【CDA干货】数据挖掘核心步骤与实战:以零售企业客户流失预测为例

【CDA干货】数据挖掘核心步骤与实战:以零售企业客户流失预测为例
2025-11-04
在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升收入、优化体验” 的隐性规律。但数据挖掘并非 “拿到数据就建模” 的无序过程,需遵循 ...

【CDA干货】DDPM 模型 loss 多少合适?从原理到实操的科学评估指南

【CDA干货】DDPM 模型 loss 多少合适?从原理到实操的科学评估指南
2025-11-04
在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算合适?” 与分类任务(如 ImageNet 分类,验证集 loss 低于 0.3 可认为效果优秀)或回 ...

【CDA干货】从啤酒与尿布到精准预测:关联规则的商业魔力

【CDA干货】从啤酒与尿布到精准预测:关联规则的商业魔力
2025-11-03
当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后、跨越直觉的关联逻辑。这个诞生于 20 世纪 90 年代的经典案例,不仅让关联规则技术风 ...

【CDA干货】《stats.ttest\_rel 与 Wilcoxon 对比决策手册》

【CDA干货】《stats.ttest\_rel 与 Wilcoxon 对比决策手册》
2025-11-03
这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 t 检验)是参数检验,依赖数据正态分布假设,适用于满足正态性的连续型配对数据;wilc ...

【CDA干货】MySQL 按顺序计数:缺失数据补全与占位符填充实战指南

【CDA干货】MySQL 按顺序计数:缺失数据补全与占位符填充实战指南
2025-10-31
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品编号统计库存”。但实际业务中,常因 “某时间段无业务”“某序号无对应数据” 导致查 ...

【CDA干货】Tableau 累计百分比计算:从基础操作到业务决策落地

【CDA干货】Tableau 累计百分比计算:从基础操作到业务决策落地
2025-10-31
在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征与贡献度,例如 “前 20% 的客户贡献了 80% 的销售额”“前 50% 的产品占据了 90% 的 ...

【CDA干货】MySQL 频繁写入同一表:影响分析与优化策略

【CDA干货】MySQL 频繁写入同一表:影响分析与优化策略
2025-10-30
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付流水、订单状态更新)、热点数据统计(商品库存、用户积分)。但当写入频率达到一定量 ...

【CDA干货】班级规模与平均成绩:相关系数计算全流程(Excel+Python 分步演示)

【CDA干货】班级规模与平均成绩:相关系数计算全流程(Excel+Python 分步演示)
2025-10-30
为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数据准备→系数选择→计算实操→结果解读” 的全流程(含 Excel/Python 工具演示),同时 ...

【CDA干货】前向神经网络隐藏层与神经元个数的确定:从原理到实操指南

【CDA干货】前向神经网络隐藏层与神经元个数的确定:从原理到实操指南
2025-10-29
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个开发者都会面临的核心决策。这两个参数直接决定了模型的 “容量”—— 即拟合复杂数据 ...

【CDA干货】Excel 辅助 K-Means 聚类实操手册

【CDA干货】Excel 辅助 K-Means 聚类实操手册
2025-10-29
这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透视图本身无法直接执行聚类分析,它是 “数据汇总与可视化工具”,而聚类分析是需要算法 ...

【CDA干货】左尾数据的正态化处理:从识别到落地的完整指南

【CDA干货】左尾数据的正态化处理:从识别到落地的完整指南
2025-10-28
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的有效性、模型的预测精度才能得到保障。但实际业务中,大量数据呈现 “左偏分布”(左 ...

OK
客服在线
立即咨询