R是目前学习R语言中应用最广泛的平台。当你认真起来学习R的时候你会找到学习R的窍门。 它之所以功能强大是因为很多机器学习的算法都是现有的。然而其中一个问题是这些算法都是由第三方提供的,这似乎让这些 ...
2016-07-25
//写在前面 在工作中,经常利用多个数据指标对整体进行综合评价,需要把多个数据压缩成一个综合指标,这就是多指标综合评价方法。 耐心学完本期内容,足够装X一整年。 //专业内容 专业术语的名 ...
2016-07-22黄振杰:用数据消灭「你妈是你妈」奇葩证明,我们还要走多远? 前几天刷微博,刷到一条新闻,说银行要求一名老大爷拿出「我儿子是我儿子」的证明,才能让他给在国外读书的儿子汇款。虽然「你妈是你妈」 ...
2016-07-21
排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。 常见的内部排序算法有:插入排序、希尔排序、 ...
2016-07-20
本文出自CDA数据分析师就业班第四期学员答辩案例 案例来源:CDA数据分析第四期就业班答辩材料,小组成员为:孙志强,张凌云,白冬青,李运超,吴金环,王亚玲。感谢他们的分享! 评委意见:报告形式条理清晰,总 ...
2016-07-19
R在统计和数据分析领域占据着越来越重要的作用,那么如何着手学习R呢? 学R主要在于5点三阶段: 第一阶段有一点:基础的文件操作(read.*,write.*)、数据结构知识,认识什么是数据框(data.frame)、列表(list ...
2016-07-18
丨背景 到2025年,保守估算,全球将拥有1000亿连接,65亿互联网用户使用超过100亿部智能手机,全球的数据总量达到百ZB,届时全球将真正是一张网。十年很快! 如果你要思考一个系统,更够集成更多数据,链接更多的 ...
2016-07-15
6月25日,CDA数据分析师认证考试(第四届)在北京、上海、深圳、广州、成都、杭州、武汉、长沙、贵阳、青岛、沈阳、福州、西安、太原14个城市轰轰烈烈拉开了序幕。 此次考试持续两天,共包含三门,分别为CDA LEVEL ...
2016-07-14
基本答一下吧,但是不是很准确,只了解大致情况(杭州),带有某种行业自黑。 丨一、第一阶段(一般岗位叫数据专员) 基本学会excel(VBA最好学会;会做透视表;熟练用筛选、排序、公式),做好PPT。这样很多传统 ...
2016-07-13
对于数据岗位的员工,互联网公司颇有些不同的称谓,像统计工程师、大数据工程师、数据分析师、算法工程师、数据科学家等,每一种之间的技能差距简直是风马牛不相及。但我觉得,数据岗位的需求千变万化,真正 ...
2016-07-09
数据可视化及哦了实操示例 下面使用数据举例如何使用哦了创建可视化图形 基础数据如下: excel中大概有2000多行数据,我们要分析的有该数据中 ...
2016-07-06
数据科学领域,Python和R正在发起战争:尽管编程语言在数据分析领域越来越突出,它们仍然努力争取成为数据科学家选择的语言。你会选择哪一种语言呢? 本文部分摘自data. ...
2016-07-05
想写这个系列很久了,最近刚好项目结束了闲下来有点时间,于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书,每本书都各有侧重点,机器学习实战和集体智慧编程更偏向与实战,侧重于对每个算法的实际 ...
2016-07-04
原来分析的都是后台交易数据,现在要分析用户浏览行为,那要怎么搜集数据,埋点要注意点什么? 十年前在一家国有大行做分析数据时,数据是从磁带上导出来的核心系统的备份数据,数据诊断时候发现少了一个月的数据, ...
2016-07-01
现今,推荐系统被用来个性化你在网上的体验,告诉你买什么,去哪里吃,甚至是你应该和谁做朋友。人们口味各异,但通常有迹可循。人们倾向于喜欢那些与他们所喜欢的东西类似的东西,并且他们倾向于与那些亲近的人有 ...
2016-06-30
英国公投选择了脱离欧洲,震惊了世界。人们究竟怎么看待这件事?机器学习分析能帮我们找到答案。 2016 年 6 月 24 日是将出现在历史课本上的一天。英国全民公投选择了退出欧盟,并在欧洲的心脏上打开了一条深深的裂 ...
2016-06-29
在顾问界,曾经有一句玩笑话,“7天了解一个行业”。这样的了解,当然不可能是深入而细致的,但是也决不能浅尝辄止。至少要在短短七天的时间,搞清楚行业的背景,价值链和盈利模式,还有典型企业的成功案例。 如果 ...
2016-06-28
此文将从销售漏斗管理分析的业务背景、Excel平台上的实施方式以及销售漏斗管理分析仪的实现过程三方面内容进行说明,希望帮助有此类业务分析需求的朋友拓展思路。 //业务背景 销售漏斗是科学反映商机状态以及 ...
2016-06-27
本期给小伙伴们分享一个干货案例。案例来自CDA数据分析研究院执行院长常国珍老师。 在此先告诉大家一个喜大普奔的好消息:经管之家CDA数据分析师与网易云课堂合作推出的微专业「数据挖掘工程师」课程即将开课啦! ...
2016-06-24
总结一下我读过的机器学习/数据挖掘/数据分析方面的书,有的适合入门,有的适合进阶,没有按照层次排列,先总结一下,等总结的差不多了再根据入门--->进阶分块写。下面列的书基本上我写的都是读完过的,不然不敢写, ...
2016-06-23在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07