数据产品经理的必修课:数据图表应用 图表是件花衣裳,你得懂得怎么穿! 初阶的饼图、环形图、折线图、柱形图、条形图等就不多说了,因为他们直观到无需解释。但需要提一下做这些图的时候的细节: (可跳 ...
2016-04-11
R语言的高质量图形渲染库Cairo R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在 ...
2016-04-11理解矩阵背后的现实意义 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍 ...
2016-04-10机器学习的认知和算法总结 相信不少人都没弄明白机器学习和数据挖掘的区别是什么?其实机器学习并不等同于数据挖掘,数据挖掘更多的是从目标角度去理解数据,然后利用算法建模探索有价值的结论;而机器学习 ...
2016-04-10
SAS数据挖掘实战篇【七】 6.5 SAS EM数据挖掘-----预测模型 1 问题定义 目标:建立模型预测贷款申请的信用状态,选择最优的模型来预测和减少损失。 数据集:SAMPSIO.DMAGECR ...
2016-04-10
SAS数据挖掘实战篇【六】 6.3 决策树 决策树主要用来描述将数据划分为不同组的规则。第一条规则首先将整个数据集划分为不同大小的 子集,然后将另外的规则应用在子数据集中,数据集不同相应的规则也不 ...
2016-04-10
SAS数据挖掘实战篇【五】 SAS——预测模型 6.1 测模型介绍 预测型(Prediction)是指由历史的和当前的数据产生的并能推测未来数据趋势的知识。这类知识可以被认为是以时 间为关键属性的关联知识, ...
2016-04-10
大数据学习之BigData常用算法和数据结构 核心思路: 由多层组成,每层都是一个有序链表,最底层包含所有元素,元素数逐层递减。每个节点包含两个指针,一个->,一个向下。 1.Bloom Filter 由一个很长的二进 ...
2016-04-10算法竞赛最有用的十种算法 Dynamic Programming (DP)appears to account for a plurality (some estimate up to a third) of contest problems. Of course, DP is also not a single algorithm that you can ju ...
2016-04-09Hadoop在大数据处理时的优劣势分析 在近两年,大数据分析似乎很受欢迎,但即使如此,仍有不少企业发现,现有的数据挖掘和分析技术还是不能完美胜任大数据的处理任务。 而对于这个问题,一个可能的解决方案就 ...
2016-04-09
SAS数据挖掘实战篇【四】 今天主要是介绍一下SAS的聚类案例,希望大家都动手做一遍,很多问题只有在亲自动手的过程中才会有发现有收获有心得。 1 聚类分析介绍 1.1 基本概念 聚类就是一种寻 ...
2016-04-09
SAS数据挖掘实战篇【三】 从数据挖掘概念到SAS EM模块和大概的流程介绍完之后,下面的规划是【SAS关联规则案例】【SAS聚类】【SAS预测】三个案例的具体操作步骤,【SAS的可视化技术】和【SAS的一些技巧和代码 ...
2016-04-09
数据进行分析并利用各种数据挖掘技术和方法选择合适的模型描述 电信资费套餐是电信运营商进行客户关系管理的手段,能使客户受惠并提高运营商收益。使用数据挖掘技术可以制定资费套餐。首先介绍了数据挖 ...
2016-04-09数据可视化不是数据分析 随着大数据中各种概念的崛起,越来越多的人开始混淆这些概念,尤其是在数据可视化和数据分析这一块,不少人认为这两者是同一个概念。而专业人士却指出,数据可视化不是数据分析。专业人 ...
2016-04-09
有时候数字确实需要分享一个美丽的故事分享! 当今社会,数据可视化是至关重要的。没有强大的可视化,几乎不可能在堆积如山的数据中创造或者叙述它的故事。这些故事有助于我们构建策略,并做出明智的商业决策。 ...
2016-04-08数据分析师常用的秘籍 说到数据分析的常用工具,大家想到的从数据存储、到数据处理、再到数据挖掘和数据分析以及到数据展示的工具可能有很多。的确,数据从互联网诞生时刻起就已经产生。围绕数据的工具也层出不 ...
2016-04-08
SAS数据挖掘实战篇【二】 从SAS数据挖掘实战篇【一】介绍完目前的数据挖掘基本概念之外,对整个数据挖掘的概念和应用有初步的认识和宏观的把握之后,我们来了解一下SAS数据挖掘实战篇【二】SAS工具的应用。 ...
2016-04-08
SAS数据挖掘实战篇【一】 1数据挖掘简介1.1数据挖掘的产生 需求是一切技术之母,管理和计算机技术的发展,促使数据挖掘技术的诞生。随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从 ...
2016-04-08
如何解决实施大数据的常见障碍 有调查表明,实现大数据的障碍按比例从大到小排列如下: 如何解决在实施大数据过程中出现的如上障碍?本文提到的4大战略可以助你将走向大数据之路的绊脚石们一 ...
2016-04-08程序员的基础和解决问题的思维很重要 为什么今天突然想说这个话题,那是因为在工作当中,被队友坑过。同样的一个功能,你让不同的人去实现,可能会有不同的实现方式,同样,就会得到不一样的结果。有些人做出来 ...
2016-04-08在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23