建立数据感性认识 变量类型和数据分布 变量类型 连续变量 离散变量(名义变量-有序,分类变量-无序) 数据分布 分布就是概率,研究变量无外乎就是看变量的值以及其取值的概率。此事数据由一大堆数 ...
2018-02-27数据挖掘中的分类技术 KNN(K最近邻算法) 算法核心:如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别,则该样本也属于这个类别,并具有这个类别的特征 在确定分类时只依靠最邻近的一个 ...
2018-02-27R描述性统计分析 概念 数据摘要,有损地提取数据特征的过程,包含基本统计,分布/累计统计,数据特征(相关性,周期性等),数据挖掘 数据有很多变量和观测值,可以用一些简单表格,图形和少数汇总数字 ...
2018-02-27数据结构中排序和查找各种时间复杂度 (1)冒泡排序 冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以相同元素的前后顺序并没有改 ...
2018-02-27大数据处理信息的六个环节 大数据按照信息处理环节可以分为数据采集、数据清理、数据存储及管理、数据分析、数据显化,以及产业应用等六个环节。而在各个环节中,已经有不同的公司开始在这里占位。 ...
2018-02-27企业绩效管理热潮下的BI实践 一、中国企业绩效管理的“热潮” 1.绩效管理“满意度”不高 目前国内企业兴起了绩效管理的热潮,在这股热潮中绩效管理流行起KPI,但是企业在KPI的应用效果并不尽如意。据一份国际4 ...
2018-02-27各种排序算法的时间复杂度 选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法,冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。 排序算法不稳定的含义是: 在排序之前,有两个数相等. 但 ...
2018-02-27常用几种排序算法的时间复杂度和空间复杂度 常用的排序算法的时间复杂度和空间复杂度 1、时间复杂度 (1)时间频度一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。 ...
2018-02-27大数据热中的冷思考 要学会判断数据 当前,由于大数据在社会实践与理论研究上的巨大影响,有关大数据的讨论已经渗透到每一个行业和领域之中,带来了各行各业对大数据的热捧。大数据显然具有重要价值,这一点毋 ...
2018-02-27数据科学职业生涯路径:如何在数据分析工作中找准自己的角色和定位 写在前面 全世界,企业每天都在创造更多的数据,迄今为止大多数都在努力从中受益。根据麦肯锡的说法,仅美国就将面临150,000多名数据分 ...
2018-02-26Python 面试中8个必考问题 Q1、下面这段代码的输出结果是什么?请解释。 def extendList(val, list=[]): list.append(val) return list list1 = extendList(10) list2 = extendList(123,[]) list3 = exten ...
2018-02-26【北京弘成学苑科技发展有限公司】招聘数据分析师 弘成教育集团(中华学习网www.chinaedu.net)成立于1998年,是由McGraw-hill、IDG等世界知名教育和投资机构投资成立的全面教育服务提供商。公司自成立以来,始终积 ...
2018-02-26【普华众鑫文化传播有限公司】招聘数据分析师 普华商学院是商业教育行业的改革者和推动者,学院以中国特色商业理论体系为核心理论基础,由翟山鹰教授发起并创办,师资汇集政府、投融资、资本运营、法律财务税务、教 ...
2018-02-26【北京华媒康讯信息技术有限公司】招聘数据分析师 健康界致力于打造中国医健领域第一媒体、第一智库与第一平台。从资讯入口到知识入口,从资源到商机,健康界用专业能力和创新精神演绎”互联网+“时代的专业媒体创业 ...
2018-02-26提升数据中心效率的10种方法 数据中心托管逐渐成为了一种企业信息化中的流行趋势,而虚拟化则在其中发挥了重要作用。那么,虚拟化与主机托管越来越流行的原因是什么?虚拟化与主机托管又在哪些方面得到了广泛 ...
2018-02-26简单易学的机器学习算法——K-Means++算法 一、K-Means算法存在的问题 由于K-Means算法的简单且易于实现,因此K-Means算法得到了很多的应用,但是从K-Means算法的过程中发现,K-Means算法中的聚类中心的个数 ...
2018-02-26数据挖掘中的特征选择问题 特征工程包括特征选择和特征提取。数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。通常而言,特征选择是指选择获得相应模型和算法最好性能的特征集,工程上常 ...
2018-02-26使用R并行方式对数值型数据离散化 数据的特征按照其取值可以分为连续型和离散型。离散数值属性在数据挖掘的过程中具有重要的作用。比如在信用卡评分模型中,当自变量很多时,并非所有字段对于目标字段来说都是 ...
2018-02-26Python统计学一数据的概括性度量 一、数据的概括性度量 1、统计学概括: 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和 ...
2018-02-26使用Python进行描述性统计 1 描述性统计是什么? 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,我们可借助描述性统计来描绘或总结数据的基本情况,一来可以梳 ...
2018-02-26如何考取数据分析师证书:以 CDA 为例 在数字化浪潮席卷各行各业的当下,数据分析师已然成为企业挖掘数据价值、驱动决策的 ...
2025-07-15CDA 精益业务数据分析:驱动企业高效决策的核心引擎 在数字经济时代,企业面临着前所未有的数据洪流,如何从海量数据中提取有 ...
2025-07-15MySQL 无外键关联表的 JOIN 实战:数据整合的灵活之道 在 MySQL 数据库的日常操作中,我们经常会遇到需要整合多张表数据的场景 ...
2025-07-15Python Pandas:数据科学的瑞士军刀 在数据驱动的时代,面对海量、复杂的数据,如何高效地进行处理、分析和挖掘成为关键。 ...
2025-07-15用 SQL 生成逆向回滚 SQL:数据操作的 “后悔药” 指南 在数据库操作中,误删数据、错改字段或误执行批量更新等问题时有发生。 ...
2025-07-14t检验与Wilcoxon检验的选择:何时用t.test,何时用wilcox.test? t 检验与 Wilcoxon 检验的选择:何时用 t.test,何时用 wilcox. ...
2025-07-14AI 浪潮下的生存与进阶: CDA数据分析师—开启新时代职业生涯的钥匙(深度研究报告、发展指导白皮书) 发布机构:CDA数据科 ...
2025-07-13LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08