R是目前学习R语言中应用最广泛的平台。当你认真起来学习R的时候你会找到学习R的窍门。 它之所以功能强大是因为很多机器学习的算法都是现有的。然而其中一个问题是这些算法都是由第三方提供的,这似乎让这些 ...
2016-07-25
//写在前面 在工作中,经常利用多个数据指标对整体进行综合评价,需要把多个数据压缩成一个综合指标,这就是多指标综合评价方法。 耐心学完本期内容,足够装X一整年。 //专业内容 专业术语的名 ...
2016-07-22黄振杰:用数据消灭「你妈是你妈」奇葩证明,我们还要走多远? 前几天刷微博,刷到一条新闻,说银行要求一名老大爷拿出「我儿子是我儿子」的证明,才能让他给在国外读书的儿子汇款。虽然「你妈是你妈」 ...
2016-07-21
排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。 常见的内部排序算法有:插入排序、希尔排序、 ...
2016-07-20
本文出自CDA数据分析师就业班第四期学员答辩案例 案例来源:CDA数据分析第四期就业班答辩材料,小组成员为:孙志强,张凌云,白冬青,李运超,吴金环,王亚玲。感谢他们的分享! 评委意见:报告形式条理清晰,总 ...
2016-07-19
R在统计和数据分析领域占据着越来越重要的作用,那么如何着手学习R呢? 学R主要在于5点三阶段: 第一阶段有一点:基础的文件操作(read.*,write.*)、数据结构知识,认识什么是数据框(data.frame)、列表(list ...
2016-07-18
丨背景 到2025年,保守估算,全球将拥有1000亿连接,65亿互联网用户使用超过100亿部智能手机,全球的数据总量达到百ZB,届时全球将真正是一张网。十年很快! 如果你要思考一个系统,更够集成更多数据,链接更多的 ...
2016-07-15
6月25日,CDA数据分析师认证考试(第四届)在北京、上海、深圳、广州、成都、杭州、武汉、长沙、贵阳、青岛、沈阳、福州、西安、太原14个城市轰轰烈烈拉开了序幕。 此次考试持续两天,共包含三门,分别为CDA LEVEL ...
2016-07-14
基本答一下吧,但是不是很准确,只了解大致情况(杭州),带有某种行业自黑。 丨一、第一阶段(一般岗位叫数据专员) 基本学会excel(VBA最好学会;会做透视表;熟练用筛选、排序、公式),做好PPT。这样很多传统 ...
2016-07-13
对于数据岗位的员工,互联网公司颇有些不同的称谓,像统计工程师、大数据工程师、数据分析师、算法工程师、数据科学家等,每一种之间的技能差距简直是风马牛不相及。但我觉得,数据岗位的需求千变万化,真正 ...
2016-07-09
数据可视化及哦了实操示例 下面使用数据举例如何使用哦了创建可视化图形 基础数据如下: excel中大概有2000多行数据,我们要分析的有该数据中 ...
2016-07-06
数据科学领域,Python和R正在发起战争:尽管编程语言在数据分析领域越来越突出,它们仍然努力争取成为数据科学家选择的语言。你会选择哪一种语言呢? 本文部分摘自data. ...
2016-07-05
想写这个系列很久了,最近刚好项目结束了闲下来有点时间,于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书,每本书都各有侧重点,机器学习实战和集体智慧编程更偏向与实战,侧重于对每个算法的实际 ...
2016-07-04
原来分析的都是后台交易数据,现在要分析用户浏览行为,那要怎么搜集数据,埋点要注意点什么? 十年前在一家国有大行做分析数据时,数据是从磁带上导出来的核心系统的备份数据,数据诊断时候发现少了一个月的数据, ...
2016-07-01
现今,推荐系统被用来个性化你在网上的体验,告诉你买什么,去哪里吃,甚至是你应该和谁做朋友。人们口味各异,但通常有迹可循。人们倾向于喜欢那些与他们所喜欢的东西类似的东西,并且他们倾向于与那些亲近的人有 ...
2016-06-30
英国公投选择了脱离欧洲,震惊了世界。人们究竟怎么看待这件事?机器学习分析能帮我们找到答案。 2016 年 6 月 24 日是将出现在历史课本上的一天。英国全民公投选择了退出欧盟,并在欧洲的心脏上打开了一条深深的裂 ...
2016-06-29
在顾问界,曾经有一句玩笑话,“7天了解一个行业”。这样的了解,当然不可能是深入而细致的,但是也决不能浅尝辄止。至少要在短短七天的时间,搞清楚行业的背景,价值链和盈利模式,还有典型企业的成功案例。 如果 ...
2016-06-28
此文将从销售漏斗管理分析的业务背景、Excel平台上的实施方式以及销售漏斗管理分析仪的实现过程三方面内容进行说明,希望帮助有此类业务分析需求的朋友拓展思路。 //业务背景 销售漏斗是科学反映商机状态以及 ...
2016-06-27
本期给小伙伴们分享一个干货案例。案例来自CDA数据分析研究院执行院长常国珍老师。 在此先告诉大家一个喜大普奔的好消息:经管之家CDA数据分析师与网易云课堂合作推出的微专业「数据挖掘工程师」课程即将开课啦! ...
2016-06-24
总结一下我读过的机器学习/数据挖掘/数据分析方面的书,有的适合入门,有的适合进阶,没有按照层次排列,先总结一下,等总结的差不多了再根据入门--->进阶分块写。下面列的书基本上我写的都是读完过的,不然不敢写, ...
2016-06-23教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28