「每天一个数据分析师」第19期内容奉上,请享用~ 编者按: 围棋人机大战一役,火的不仅是AlphaGo和李世石,还有机器学习。作为人工智能的一个分支,机器学习越来越受到瞩目。本期C君采访了计算机科学博士邹博老师 ...
2016-03-24
编者按:本文是松子(李博源)的大数据平台发展史系列文章的第一篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统与非传统两个行业。是对数据平台发展的一个回忆,对非互联网、互联网,从 ...
2016-03-22
在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介 ...
2016-03-21
巴别塔的轰塌 圣经旧约第十一章,讲到了巴别塔的故事:人类联合起来兴建希望能通往天堂的高塔;为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,人类的宏伟计划因此失败,自此各散东西。 ...
2016-03-17
本期,C君非常荣幸地邀请到了国家电网能源研究所的孙艺新老师。能源行业作为国民经济与社会发展的基础,不可避免地正在受到大数据的深刻影响。在下文中,孙艺新老师结合案例,系统分析了国外几种电力大数据应用案例 ...
2016-03-15
编者按:今天李世石同学又输了,感觉这个曾经的“不败少年”即将成为让广大网友集体心疼的第二个小李子。那个小李子已经拿着奥斯卡逆袭成功了,这个小李子前方的道路依然曲折…… 我们心疼代表全人类出站的小李同学 ...
2016-03-11
3月9日下午,经过3个半小时的激战,李世石九段投子认输,Alpha Go再次战胜人类。 根据日程安排,5局棋将分别于3月9日、10日、12日、13日和15日举行,即使一方率先取得3胜,也会下满5局。比赛采用中国规则,执黑一方 ...
2016-03-10导读:社会化(众包)模式是指一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法模式。直白点说,某公司提供一个平台让大家可以在上面发布需求,另一部分 ...
2016-03-09
文/王安 CDA作者库成员 今天女神终于答应和我约会了,可不能迟到,开车还是地铁? 对于这样一个重要的约会,既要选择交通工具,还要决定几点出发,这些决策都要面临一个非常大不确定性,就是交通状况,如果 ...
2016-03-08
未来我想做数据分析师,是去甲方公司比较好,还是乙方公司比较好? 最近几个要转行或毕业的朋友都谈起这个话题,作为一个未来的数据分析师,这是个需要面对的问题。数据分析师在甲方和乙方的职能有所不同,各有特点 ...
2016-03-04“每天一个数据分析师”在第九期有幸采访了李敏,她是管理科学与工程专业博士生,同时是中国首批数据建模师(CDA 2),目前在上海某三甲医院工作。 DA:您是如何入行的? 李敏:2005年跟随先生举家 ...
2016-03-02
概述 本文将探究一个被称为二次规划的优化问题,这是一种特殊形式的非线性约束优化问题。二次规划在许多领域都有运用,比如投资组合优化、求解支持向量机(SVM)分类问题等。在R中求解二次规划有许多包,这次, ...
2016-03-01
12月的CDA考试,看看状元们都说了些啥? 第三届CDA数据分析师认证考试,在刚刚过去的2015年12月月底悄悄落下帷幕。 热腾腾的成绩已经揭晓,崭新新的证书大抵都抵达每位通过考试的持证人手中啦! CDA数 ...
2016-02-01
采访/整理:Penny CDA原创 转载请注明来源 人物档案厚龙,毕业于重庆工商大学,本科和硕士都是统计专业,现在北京某互联网金融公司负责风险控制工作。 丨公关 作为统计系的学生,读书时就常常参加各种数学建模竞赛 ...
2016-01-22
文/张涵诚 接下来我给大家分享一下我对大数据和共享经济的理解,共享经济大数据的话题我分为五个部分跟大家介绍,分别是:大数据产业生态分析、大数据2.0就是共享经济,共享经济的分享路径、共享经济的产业格 ...
2016-01-18
互联网行业在大数据的积累和应用以百度、腾讯和阿里巴巴最为值得关注。百度、腾讯和阿里巴巴在大数据的应用上虽然有共同的地方,但由于各自的数据来源和商业模式的不同,其大数据应用也有不同的特色。本文将分析他 ...
2016-01-15
1月8日,2016大数据生态纵览峰会在北京圆满落幕。30多名嘉宾参与分享,20多家企业共同参与,30多家媒体参与报道,1000多名与会者见证了这场盛会。如果你错过了,确实有点遗憾。不过没关系,现在来一次回放,一起来 ...
2016-01-13
1月8日,2016大数据生态纵览峰会在北京成功举办。逾千名来自全国各地的大数据行业从业者和业内知名专家、领军企业高管汇聚一堂,共同探讨中国大数据行业的发展现状和未来走向。 此次峰会由经管之家CDA ...
2016-01-11
采访/整理:Penny 本文来自:CDA数据分析师 微信公众号 人物档案 张逍然 张逍然,江湖人称二乖,目前在传统制造行业,拥有一颗热爱数据分析的心,CDA数据分析师Level1学员,今年11月份参加 ...
2015-12-14
大麦网周宇红:用大数据打破票务行业的天花板 采访|Penny 来自CDA数据分析师微信公众号 想参与采访的同学可以发送以下内容“每天一个数据分析师+姓名+联系方式”至songpeiyang@pinggu.org 人 ...
2015-12-14教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28