作者 | Jeremie Harris 翻译 | Mika CDA 数据分析师原创作品,转载需授权 我在一家数据科学培训公司工作。对于学员,我常常给出的建议并不是推荐库或者工具,而是让他们首先明确自己想成为什么 ...
2018-12-18在前面提到的数据获取与数据存取的知识,一般来说,数据获取和数据存取是数据分析的必要条件,数据分析师在分析数据的时候首先需要数据,没有数据我们还分析什么呢?可见数据获取和数据存取是很重要的, ...
2018-12-17我们在进行数据分析工作的时候,都会对于数据进行一系列的操作,这些操作使得数据分析能够得出一个准确的结果,但是我们对于数据分析之后还是需要进行数据展现的,如果只分析不展现,那么数据分析工作毫 ...
2018-12-17大家都知道,不管是什么行业都会有一些专业性强的语言,这就是术语。当然,数据分析行业也不例外,我们在进行数据分析的时候在进行数据分析的时候也会遇到很多的术语,但是这些术语都代表什么意思呢?小 ...
2018-12-17数据分析是时下十分热门的一个就业方向。在互联网迅速膨胀的年代,各行各业都少不了数据分析。数据分析是一门很深的学问,其中蕴含了不少知识。今天我们就从3个方面来为大家简单地介绍一下数据分析的相关 ...
2018-12-17数据分析行业是需要很多的基本功知识以及很多的实战经验学习,才能够胜任数据分析领域的工作。很多人通过学习能够提高数据分析的知识,但是数据分析能力的提高效果不是很理想。虽然学会了数据分析的知识 ...
2018-12-17想要做好数据分析,一定要提前了解好关于数据分析的一些相关知识,比如数据分析常用的软件有哪些?我们在做数据分析时,一定要提前做好充分的了解。今天要和大家分享的内容是数据分析中常用的五种软件, ...
2018-12-17大家都知道,在进行数据分析的时候需要先挖掘数据和存取数据,这样才能够为数据分析工作打好基础。但是在一般情况下,数据挖掘出来之后是有很多无用重复的数据的,如果将这些数据直接分析的时候会影响分析结果 ...
2018-12-17很多人在进行数据分析的时候总是会有些迷惑,那就是不知道怎么去进行数据分析或者数据分析到底要何处下手,其实这个问题的症结就是对数据分析没有一个明确思路。在进行数据分析的时候,我们可以制定一个 ...
2018-12-17很多人想进入数据分析行业,于是就想通过学习进入到数据分析领域。但是一般来说,数据分析领域也不是随随便便说学就学的,只有符合一些条件才能够更轻松地跟上数据分析领域的教学知识。此外还有不少人不 ...
2018-12-17很多人看到了数据分析行业的火爆以及好的待遇,但是不知道数据分析师的具体薪资是多少。对于这个问题我们需要分析三个方面,第一就是数据分析师的薪资分布式怎样的;第二是不同城市的薪资水平如何;第三 ...
2018-12-17数据分析行业越来越火爆,很多人对于数据分析行业不是很了解,如果想进入数据分析行业的话,没有对数据分析的深刻理解和认识是不行的,对于数据分析师来说,了解数据分析的基本内容,是进入职场的必修课 ...
2018-12-14很多人学习过数据分析的知识,但是一到了真正接触项目时却不知道怎么分析了,就好比人们练武术,平常练习的时候一招一式都能练的非常熟练,但是打实战的时候就完全忘了动作,无法一气呵成或者融会贯通。 ...
2018-12-14我们在上一篇文章中给大家讲了数据预处理、概率论和统计这两方面的知识,这两个模块在数据分析中也是十分重要的。当然了学会这些去分析数据的时候还是不够的,因为这些知识去分析数据还差点火候,还需要 ...
2018-12-14在上一篇文章中我们提到的需要获取外部数据和不需要获取外部数据的数据分析师所需要学习的技能,他们所需学习的技能知识之间差了一个Python爬虫。当然了,还是需要学习很多的知识的,在这篇文章中就有小 ...
2018-12-14在学习某种技能的时候,我们首先需要知道自己的目的是什么,学了这个技能能够解决什么问题,想必大家在学习技能的时候已经有了自己的想法。就比如说现在很多人想学数据分析知识。学数据分析知识需要制订 ...
2018-12-14在上一篇文章中我们提到的数据预处理的数据清洗,数据清洗就是对于肮脏数据的清除,而肮脏数据主要有异常值和缺失值,我们在进行数据预处理的时候不但要注意数据的清洗,还需要注意数据的集成、数据变换 ...
2018-12-14数据分析中,需要先挖掘数据,然后对数据进行处理。数据预处理的字面意思就是对于数据的预先处理,数据预处理的作用就是为了提高数据的质量以及使用数据分析软件。对于数据的预处理的具体步骤就是数据清 ...
2018-12-14作者 | George Liu 翻译 | Mika CDA 数据分析师原创作品,转载需授权 如果你是一名数据科学方面的求职者,你肯定想知道在简历上写些什么才能获得面试的机会;如果你想进入这个领域,你一定想 ...
2018-12-14现在很多人都听说过数据分析和数据科学,但是很多人不知道怎么区分数据分析和数据科学,可能对数据分析和数据科学会造成混淆。大家都知道,数据分析和数据科学这两种事物都是有一定的关联的,这是因为提 ...
2018-12-13在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30