如何基于数据快速构建用户模型(Persona) 用户模型(Persona)是Alan Cooper在《About Face:交互设计精髓》一书中提到的研究用户的系统化方法。它是产品经理、交互设计师了解用户目标和需求、与开发团队及相关 ...
2016-05-07
小波变换通俗解释 从傅里叶变换到小波变换,并不是一个完全抽象的东西,可以讲得很形象。小波变换有着明确的物理意义,如果我们从它的提出时所面对的问题看起,可以整理出非常清晰的思路。 下面就按照傅里叶 ...
2016-05-07
处理多重共线性问题 一、多重共线性的表现 线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系。看似相互独立的指标本质上是相同的,是可以相互代替的,但是完全共线性的情况并不多见,一般出 ...
2016-05-07
定位目标找用户,分类筛选决策树 营销测试方法通过广告宣传引导用户开通或试用产品,并分析其中响应的用户特点。与营销测试有所不同,存量用户建模的反馈数据不需要经过市场测试,而是根据存量用户是否使用该产品 ...
2016-05-07
如何看懂数据分析中的数据? 对于数据,有一个共识就要会看数据,通过合理及透彻的分析来驱动产品,运营及市场策略的调整。但是这些知识看数据的中级阶段,高级阶段则是通过庞大的多维度的数据分析,能够预测到 ...
2016-05-06
两样本估计和假设检验范例分析 基础准备 两样本推断性统计基础:两样本估计和假设检验基础。 均值差 通过对比单样本估计和假设检验的学习,可以列出独立两样本均值差的估计和假设检验在不同情 ...
2016-05-06
小白学数据:一篇文章看懂NoSQL数据库 如果你关注大数据科技动向,可能听说过一个叫NoSQL数据库的名词,这可能让人有些云里雾里。其实我们处在一个激动人心的技术更迭时代,以甲骨文为代表的SQL数据库已经称霸 ...
2016-05-06
基于树的建模-完整教程(R & Python) 基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关 ...
2016-05-06掌握8项技能让你顺利受雇于4种逼格最高的数据科学岗位 你想找到一份数据科学家的工作吗?如果你有这样的想法的话,那么你就有伴儿了。最近由Thomas Davenport和D.J. Patil在《哈佛商业周刊》上面发表了一篇专栏 ...
2016-05-06
矩阵分解在推荐系统中的应用:NMF和经典SVD实战 数据 关于NMF,在隐语义模型和NMF(非负矩阵分解)已经有过介绍。 用户和物品的主题分布 运行后输出: 可视化物品的主题分布 ...
2016-05-06
5分钟轻松上手ECharts数据图表系统 最近在捣鼓各种插件各种框架,发现这个ECharts还是比较不错的,文档也挺全的,还是中文的,给大家推荐一下。 这篇文章是零基础入门ECharts图表的教程,先简单介绍 ...
2016-05-06
到底该使用哪一种大数据编程语言:R、Python、Scala和Java 说到处理大规模数据,R、Python、Scala和Java基本上都能满足你的要求。 你有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基 ...
2016-05-06
浅谈餐饮数据分析 半年来,笔者有强烈危机感。身处互联网革新年代,社会进步的强度和烈度不亚于“第一次工业革命”,未来3-5年重复性的工作将被程序取代、知识获取门槛越来越低、折旧速度越来越快、高端技术或 ...
2016-05-06
R语言数据挖掘实战案例:电商评论情感分析 随着网上购物的流行,各大电商竞争激烈,为了提高客户服务质量,除了打价格战外,了解客户的需求点,倾听客户的心声也越来越重要,其中重要的方式 就是对消费者的文本评论进 ...
2016-05-06
掌握机器学习技术从这些编程语言和程式库开始 在我们之前分享的文章《一名合格的机器学习工程师需要具备的5项基本技能,你都get了吗?》收到了读者的热烈响应。在这片广受赞誉的文章当中我们向大家介绍了成为 ...
2016-05-06
深入理解SQL大逻辑 1、只要结果不问过程 当我们写出一条SQL语句后,SQL语句是到数据库中去执行的,具体怎么理解和执行SQL是数据库的事,我们关心的事儿就是如何写好SQL语句,别让数据库对我们的SQL产生误解 ...
2016-05-06
面向高维度的机器学习的计算框架-Angel 为支持超大维度机器学习模型运算,腾讯数据平台部与香港科技大学合作开发了面向机器学习的分布式计算框架——Angel 1.0。 Angel是使用Java语言开发的专有机器学习计算 ...
2016-05-06
简单6步,用数据说服你的听众 在之前我提出数据视觉化可以成为大家说服听众的秘密武器。 我想提供一些可以让大家有效地和自己的团队分析数据的可行建议。 在我的职业生涯中, 我开过无数个“痛苦的”会议, ...
2016-05-06数据科学团队的自测题 数据科学家具备很多相邻领域的技能,至少是基本技能(比如工程、开发和运维、产品管理、数学、研究、写作、商业等等),团队最容易出问题的地方之一,就是他们无法专注于那些需要动用这一 ...
2016-05-06
如何搭建一个数据分析指标体系 什么是指标体系 “指标体系”这个概念是应用比较广泛的,我们从正式出版物中摘取一个定义: 指标体系,即统计指标体系,是由一系列具有相互联系的指标所组成的整体 ...
2016-05-06教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28