R语言之纵向数据分析:多级增长模 上一次,我们讨论了如何对长型数据转换成长型的数据,同时还是用了一个随机创建的对照实验数据集来对其增长趋势进行可视化。但是,我们是否能够进一步的分析并预测结果的增长 ...
2016-10-17R数据分析案例:逻辑回归 逻辑回归,也称之为逻辑模型,用于预测二分结果变量。在逻辑模型当中,输出结果所占的比率就是预测变量的线性组合。 这篇文章将要使用下面这几个包,而且你们需要保证在运行我所举 ...
2016-10-17R语言多项式回归 含有x和y这两个变量的线性回归是所有回归分析中最常见的一种;而且,在描述它们关系的时候,也是最有效、最容易假设的一种模型。然而,有些时候,它的实际情况下某些潜在的关系是非常复杂的, ...
2016-10-17如何使用线性回归分析来预测发电厂的发电量 在这篇文章中,我将会教大家如何通过拟合一个线性回归模型来预测联合循环发电厂(CCPP)的发电量。这个数据集则来自于UCI Machine Learning Repository。这个数据集 ...
2016-10-17数据分析师,少一点套路,多一点思路 数据分析师在如今大数据时代有着举足轻重的地位。一个出色的数据分析师是能够通过自身对公司业务的理解,为各个层面提供有效,可靠的信息,并对其进行评价和预测。 作为一 ...
2016-10-16如何成为一名真正的数据分析师或者数据工程师 一.入门:高屋建瓴 数据分析的坑很大,一开始走上这条路,就要明确基本的方向,依托于核心的思想,不然只会越走越偏,最后觉得山太高水太深,不了了之。 ...
2016-10-16手把手教你使用R语言的主成分分析对城管事件数据分析 概念性的东西就不说那么多了,这次使用主成分分析主要目的并不是降维,而是分析城管数据中的事件类别之间是否存在关系,当然,城管事件类型有好几百,这里 ...
2016-10-16大数据分析流程 这篇文章来自一个公司内部的分享,是自己所服务的业务中数据平台的发展历程,已经讲了有几个月了,最近打算挑几个点拿出来用文章的形式写出来。是自己进入公司以来参与过或者接触过的数据型项目 ...
2016-10-16数据挖掘工程师的面试问题与答题思路 机器学习、大数据相关岗位根据业务的不同,岗位职责大概分为: 1、平台搭建类 数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能 ...
2016-10-16商业数据挖掘的13种应用场景,你了解多少 数据挖掘涉及到公司运营的方方面面,这包括对企业部门经营情况的评估、内部员工的管理、生产流程的监管、产品结构优化与新产品开发、财务成本优化、市场结构的分析和客 ...
2016-10-16数据分析方法:非参数检验 前面介绍了T检验和方差分析,它们解决的是正态分布的高测度数据的均值差异性问题。对于非正态分布的高测度数据,T检验或方差分析的方法就不再适用了。 均值差异性的检验方法:Z检 ...
2016-10-15透析数据分析与数据挖掘的区别 数据分析(狭义)与数据挖掘的本质都是一样的,都是从数据里面发现关于业务的知识(有价值的信息),从而帮助业务运营、改进产品以及帮助企业做更好的决策. 从分析的目的来看 ...
2016-10-15一个公式、五大指标帮你构建产品经理数据分析思维 1. 了解业务,熟悉数据框架、体系 了解你的业务是做什么的,业务的发展规划有什么,衡量的核心指标有哪些,列出KPI或是核心指标,一般重点指标就那么几个; ...
2016-10-158个数据分析方法,指导营销策略 营销是企业根据目标用户的需求提供产品和服务,实现盈利的一切经营活动,关于营销的数据分析,有哪些工作可做,该怎么做? 分析思路 1、对谁营销-用户行为的分析 用户 ...
2016-10-15数据分析,你真的准备好了吗 最近很多同学咨询新手如何入门数据分析的事情,虽然网上类似的文章不少,但还是根据同学们的问题作了梳理回答。本文主要从职业选择角度解析数据分析适合的人群以及入门所需的基本准 ...
2016-10-15用R做一个灵活的时间序列数据可视化工具 一、数据可视化的烦恼 数据分析师经常需要看数据。通常而言,数据或存放在MySQL数据库,或存放在Hadoop集群,或存放在阿里云的ODPS上。分析师根据业务需求写SQL语句 ...
2016-10-15实际工作中的数据挖掘流程 数据工作者最长也是有效的一种工作方式是带项目,无论是数据分析还是专项挖掘,项目制能使数据尽量贴近业务并且有效理解业务和数据的各个维度。那么如何建立面向业务落地的数据分析( ...
2016-10-14数据科学家/统计学家应该养成哪些好习惯 1、永远不要轻信自己的分析结果,多用业务和常识去检验。 很多时候,我们的分析都是含有一些潜在的假设,而在分析过程中被忽略。比如最经典的案例是在1948年,盖洛普 ...
2016-10-14从零开始学数据分析,新手教程攻略 所有从底层数据工作者往上发展的基本路径: 1. 第一阶段(一般岗位叫数据专员) 基本学会excel(VBA最好学会;会做透视表;熟练用筛选、排序、公式),做好PPT。这样很多传统 ...
2016-10-14数据分析师的职业进阶之路 数据分析师作为一个出现时间不长的工种,大数据时代下,成为螺丝钉还是成为龙头,需要尝试新的可能。” 数据分析师的职业规划 数据分析师手中拥有一座宝藏。作为滴滴出行数据分 ...
2016-10-14在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29