跳出大数据分析误区 “我知道每样从货架上移走的商品,我知道拥有会员卡的消费者的很多信息, 但是,当我们在货架上摆上与消费者购买的商品类似的产品时,并没有看到预期的收入增长。”这是为什么? ...
2016-03-01
数据分析必须掌握的分析术语 作为数据分析师,首先要了解各个数据分析软件,但是必须要知道分析术语,下面就谈谈数据分析必须掌握的分析术语。 1、增长: 增长就是指连续发生的经济事实的变动, ...
2016-03-01数据分析师的完整流程与知识结构体系 此图整理自微博分享,作者不详。一个完整的数据分析流程,应该包括以下几个方面,建议收藏此图仔细阅读。 完整的数据分析流程:1、业务建模。2、经验分析。3、 ...
2016-03-01
美国计算机科学家,LaTex的作者Leslie Lamport说:“分布式系统就是这样一个系统,系统中一个你甚至都不知道的计算机出了故障,却可能导致你自己的计算机不可用。”一语道破了开发分布式系统的玄机,那就是它的复杂 ...
2016-02-291.请教各位大牛一个问题,用python的pandas库读取excel数据后,运行时总是提示ValueError:InputcontainsNaN,infinityoravaluetoolargefordtype(\'float64\').但是仔细检查数据源也没有出现空值,请问这是什么原因 ...
2016-02-29
Excel函数之N函数应用实例:为公式加注释 很多朋友在用Excel是,都会遇到一些问题,前几天和几个朋友聊天时说道如何用Excel函数为公式加注释? 本文介绍如何为公式添加注释(批注)。我们先来看看Excel中N函 ...
2016-02-29Excel函数技巧:如何利用运算符巧妙替换逻辑函数 好多刚学数据分析师在用Excel时,对Excel函数技巧总是掌握不好,特别是如何利用运算符巧妙替换逻辑函数,下面就详细说下。 在逻辑值与数值的关系中,利用“ ...
2016-02-29
数据科学:数据、学习和建模 这里有些关键的机器学习概念可以帮助我们理解这一领域的相关知识。 在这篇文章中,你会接触到一些相关的专业术语(常用的术语),它们用来描述数据和数据集。你也会学习到 ...
2016-02-29
20道问题识别假的数据科学家 雇用数据科学家是不容易的工作,特别是当有一群假的数据科学家在里面装腔作势。这儿有现成的一些问题能够帮助区分真假的数据科学家。 21道必须懂得的关于数据科学的面试问题和答 ...
2016-02-29
R如何确定最适合数据集的机器学习算法 抽查(Spot checking)机器学习算法是指如何找出最适合于给定数据集的算法模型。 本文中我将介绍八个常用于抽查的机器学习算法,文中还包括各个算法的R语言代码,你 ...
2016-02-29
从“数据报告”到“调研报告” 记得刚开始看到调研报告的时候,特别感慨,“这也用软件做,这数据计算我用算盘也算出来了”,整篇都是条形图、饼图。看着那些数据,脑子都能想到统计过程:假如100个人答 ...
2016-02-28
网站分析数据收集方式详解 回顾网站数据分析历史,从“您是第***位来访用户”到现在百家齐放的专业工具提供商,网站分析已经逐渐发展衍化成一门科学。但面对形态各异的分析数据,很多人仍然困惑于数据的来源, ...
2016-02-28
数据分析报告中如何选择合适的统计图表 由于不同的数据分析工具收集到的数据千差万别,基于这些数据生成展示的统计图表也不尽相同;而且数据分析师制作各种报告时,也常常纠结于如何选择合适的图表表达 ...
2016-02-28
SAS 中的Order By - Proc Sort 1.排序proc sort proc sort在按数据集中某一个变量或几个变量的升序或降序将记录重新排列,并把结果保存在输出数据集中,如果不另外指定输出数据集,则覆盖输入数据集。 ...
2016-02-28R语言-RJDBC连接Teradata 第一步:从Teradata官方网站现在JDBC driver 第二步:把Driver放在一个目录下(我放在C:\\JDBC) 第三步:为R按照RJDBC package install.packages(\"RJDBC\") 安装成 ...
2016-02-28通过SAS fastload Mysql table 到 Teradata 我们在用SAS经常会会遇到一些问题,比如如何通过SAS fastload Mysql table 到 Teradata?下面就详细的说一下。 [c-sharp]view plaincopyprint? ...
2016-02-28
oracle大数据量的导入和导出 在Oracle中批量数据的导出是借助sqlplus的spool来实现的。批量数据的导入是通过sqlload来实现的。 大量数据的导出部分如下:/**************************** sql脚本部分 demo. ...
2016-02-27NPOI大数据分批写入同个Excel 要导出来的数据库数据量很大,一次取出来压力有点大,故分批取出来,导入到同一个Excel。 因为Excel2003版最大行数是65536行,Excel2007开始的版本最大行数是1048576行,故NPOI导 ...
2016-02-27
Word数据变身专业Excel数据大拿 各种数据都等着你来整理?免不了还有文本格式的数据需要收拾。如何将其迅速转化为Excel格式以便实时更新?打开Word文档>选择数据>布局>数据>转换为文本>选择“制表符”>另存为 ...
2016-02-27mysql导入数据大小设置方法 MySQL导入数据库文件最大限制2048KB和phpmyadmin导入数据最大限制2048KB的解决方法 解决办法: 1、打开php.ini。找到 upload_max_filesize 、 memory_limit 、 post_max_size ...
2016-02-27在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27