数据科学家日常工作的15项原则 作为一个数据科学家,我为我的日常工作总结开发出15项原则,这些是我本人也遵循的: 1、不要用数据说谎或吹牛: 对经验性证据要诚实坦率。最重要的是不要用数据自欺欺人。 2 ...
2016-10-14
数据分析相关笑话,只有数据人才懂 1、“我是搞数据分析的,学会了如何从DW中用SQL对数据ETL并建立了Cube。然后算啊算啊算,得出结论:今年2月份营业收入远远小于其它月份。我试图用spss、sas中的数据挖掘模型 ...
2016-10-14数据科学有利于数据挖掘,数据分析 “数据科学家”这一术语尚未失去吸引力,据Metamarkets公司的共同创始人及首席技术官Michael Driscoll说。Metamarkets是一家为数字、社交和移动媒体公司提供预测分析的创业公 ...
2016-10-13管理者常犯的4个关于数据分析的错误 有关数据和数据分析的高谈阔论比比皆是。不断有人告诫各大公司要规划恰当战略来收集分析大数据,并警告不这么做可能带来的不良后果。像《华尔街日报》近日就提到公司享有客 ...
2016-10-13
分分合合之数据科学家浅析 随着国家大数据行动计划的发布,大数据相关的新词频出,其中“数据科学家”一词更是横空出世貌似高不可攀。那我们来看看这个所谓的数据科学家到底是新瓶装旧酒还是新瓶装新酒? ...
2016-10-13
谈一谈到底该如何学习数据分析 看到不止一个QQ群里面的有很多人都问过如何学好数据分析,这个一个比较大的命题,很难一两句话弄说的明了,所以这个的问题很难在QQ群里得到一个满意的答案。好吧,那我就以一个这 ...
2016-10-13
数据分析师、数据科学家常见的77个面试问题 随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数 ...
2016-10-13
学习R的三种境界,你达到了吗 王国维在《人间词话》中将读书分为了三种境界:\"古今之成大事业、大学问者,必经过三种之境界:\'昨夜西风凋碧树,独上高楼,望尽天涯路\'。此第一境也。\'衣带渐宽终不悔,为伊 ...
2016-10-13
机器学习、大数据等岗位面试时遇到的各种问题总结 自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器 ...
2016-10-12
R语言实战:R语言介绍 我们分析数据的方式在近年来发生了令人瞩目的变化。随着个人电脑和互联网的出现,可获取的数据量有了非常可观的增长。 商业公司拥有TB级的客户交易数据,政府、学术团体以及私立研究机 ...
2016-10-12
R语言实现交通行业事故案例之黑点确定 浅谈道路黑点定义,定义黑点道路为历史发生事故起数较多和近期发生事故明显增多两种道路,并且用简易事故、一般事故、较大事故、特大事故确定当前发生事故的严重程度,即 ...
2016-10-12
R语言ARIMA预测交通流量 交通流量预测分析研究是智能运输系统的核心研究内容之一,实例使用ARIMA(p,d,q)-差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序 ...
2016-10-12
R语言数据分析实战:数据结构(2) 4、数据框 由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。它与你通常在SAS、SPSS和Stata中看到的数据集类似。数据框将是你 ...
2016-10-12
R语言数据分析实战:数据结构(1) 一、数据集的概念 数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。表2-1提供了一个假想的病例数据集。 不同的行业对于数据集的行和列叫法不同。 ...
2016-10-12
数据挖掘与数据分析梳理 一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: ...
2016-10-11
统计学中的基本概念 1、描述统计与推断统计 描述统计(Descriptive Statistics):用表格、图形和数字来概括、显示数据特征的统计方法。 例1:2005年我国出生人口性别比(男:女)已经升高到119.92,与正 ...
2016-10-11
你应该知道的7种类型的回归技术! 回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回 ...
2016-10-11
数据分析师如何打磨自己的业务深度 如何打磨自己的业务深度。 对于初级的数据分析师有条件的可以考虑到业务部门实习一段时间,销售、市场、营运部门都可以待一段时间,这对提高业务理解度会有直接的帮助的。 ...
2016-10-11
一大波Excel日期函数来袭,赶快收藏备用啦 日期就是一组特殊的序列值。如果在单元格中输入1,然后设置成日期格式,看看是不是变成了1900年1月1日? 日期函数主要用于计算星期、工龄、年龄、账龄、利息, ...
2016-10-11
聚类分析实战解析与总结 聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分为若干组 ...
2016-10-10在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06