大数据时代最该关心的事儿-CDA数据分析师官网

OpenCV入门及应用案例：手把手教你做DNN图像分类

作者：吴至文郭叶军宗炜李鹏赵娟来源：大数据DT(ID：hzdashuju) 内容摘编自《OpenCV深度学习应用与性能优化实践》导读：本文将介绍OpenCV的源码结构、OpenCV深度学习应用的典型流程，以及深度学习 ...

2020-07-09

python数据分析常用的库有哪几种？

1、Numpy NumPy 是一个 Python 包。它代表 “Numeric Python”。它是一个由多维数组对象和用于处理数组的例程集合组成的库。它是Python创建的所有更高层工具的基础。以下是它提供的一些功能： a、N维数组 ...

2020-07-09

计算机视觉--图像的基础知识

计算机视觉是一门研究如何让计算机“看”的学科。简单来说，就是指利用摄影机和电脑等机器，来代替人眼对目标进行识别、跟踪以及测量等，并进一步对图形进行处理，使之成为更适合人眼观察或传送、检测的图像。 ...

2020-07-09

图像上采样常用的插值方法有哪些？

上采样（upsampling）或图像插值（interpolating）的主要目的是将源图像放大，从而能够更高分辨率的显示设备上显示。上采样的原理：上采样（upsampling），图像放大几乎都是采用内插值方法，即在原有 ...

2020-07-09

不平衡数据处理常用方法--下采样

机器学习中，当原始数据的分类极不均衡，需要对不平衡数据进行处理，而下采样就是处理方法之一。简单来说就是从多数类中随机抽取样本从而减少多数类样本的数量，使数据达到平衡。下采样，通常适用于 ...

2020-07-09

梯度提升决策树到底是一种怎样的算法？

梯度提升决策树(GBDT)，全称为Gradient Boosting Decision Tree，是一种迭代的决策树算法，由多棵决策树组成，将所有树的结论累加起来，产出最终答案。这也就意味着在GBDT中，CART决策树为基学习器，也就是每 ...

2020-07-09

决策树剪枝，常用这2种方法

前面我们了解了决策树的概念，现在来了解一下决策树剪枝。可能会有人问：为什么要剪枝?答案是：如果一棵决策树完全生长，那么这棵决策树所对应的每一个叶节点中只会包含一个样本，就很有可能面临过拟合问题，因此 ...

2020-07-09

如何快速简单的理解决策树的概念？

决策树(Decision Tree)是机器学习中一种常见的算法，它的思想非常朴素，就像我们平时利用选择做决策的过程。决策树是一种基本的分类与回归方法，当被用于分类时叫做分类树，被用于回归时叫做回归树。一、决策 ...

2020-07-09

XGBoost算法的这3类参数，你知道吗？

XGBoost是诞生于2014年2月的一种专攻梯度提升算法的机器学习函数库，它有很好的学习效果，速度也非常快，与梯度提升算法在另一个常用机器学习库scikit-learn中的实现相比，XGBoost的性能可以提升10倍以上。还有，X ...

2020-07-09

如何用SQL语句添加和修改字段？

用SQL语句添加字段并不难，下面小编整理了SQL添加和修改字段的基本命令，希望对各位小伙伴有所帮助。增加字段： alter table 表名 add 字段名 type not null default 0 在指定位置插入新字段: alter ...

2020-07-09

mysql数据库（库操作和表操作）常用基本命令汇总

库： show databases;显示所有数据库 create database <数据库名> ;创建数据库 use <数据库名>;使用数据库 drop <数据库名> 直接删除数据库, 不提醒 show tables; 查看当前数据库中的表 desc na ...

2020-07-09

学习曲线--帮你清晰判断过拟合和欠拟合

前面小编给大家简单介绍过拟合和欠拟合时，提到了一个概念：学习曲线，我们通过学习曲线能够很清晰的判别出模型现在说出的状态是欠拟合还是过拟合，下面小编具体整理了学习曲线的相关内容，希望对大家有所帮助。 ...

2020-07-09

对于KNN算法概念以及原理的简单理解

KNN的全称是K-Nearest Neighbors，具体意思为K个最近的邻居。KNN算法可以说是机器学习算法中最简单、最基础的算法了。既能用于分类，也能用于回归。是通过测量不同特征值之间的距离来进行分类。 KNN的基本思路 ...

2020-07-09

你需要掌握的4种常用数据降维方法

近来数据记录和规模属性都在急剧增长，由于大多数数据挖掘算法都是直接逐列处理数据，因此导致算法越来越慢。为了保证减少数据列数的同时，丢失的数据信息尽可能少，数据降维处理算法应运而生。一、降维的 ...

2020-07-09

这3种数据标准化方法，你知道吗？

数据标准化(normalization)是一个常用的数据预处理操作，就是对原始各项指标数据按比例进行缩放，将数据的单位限制去除，转化为无规模、无量纲的纯数值，减少规模、特征、分布差异等对模型的影响，以便于不同单位 ...

2020-07-09

教你用数据分析的方法填报志愿

今天是2020年7月8日，高考第二天，小编祝各位考生超常发挥，取得好成绩。对很多人来说，高考都是人生的一次重要转折，但小编觉得，其实应该是高考+志愿填报，才是真正的人生转折点。高考 ...

2020-07-09

应该怎样看待数据分析？是技能还是职业？

目前数据分析行业大火，人人都想学习数据分析，但是是应该把数据分析当成一种工具呢?还是一种职业? 其实小编是比较倾向于：数据分析是一种技能的，下面具体解释一下。我们先来看一下数据分析的定义： ...

2020-07-08

3种常见集成算法模型的详细理解

集成算法（Emseble Learning）是构建多个学习器，然后通过一定策略将这些学习器组合起来，让它们来完成学习任务的，通常可以获得比单一学习显著优越的学习器。常见的集成算法模型有：Bagging、Boosting、Stack ...

2020-07-08

过拟合(over-fitting)出现的原因及相应的解决方法

过拟合(over-fitting)是指机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在验证数据集以及测试数据集中表现不佳。也就是referstoa模型对于训练数据拟合程度过高的情况。通过学习曲线来理解 ...

2020-07-08

如何理解欠拟合？常用的处理方法有哪些？

一、欠拟合概念及理解机器学习中欠拟合是一个常见的问题，简单来说就是模型在训练和预测时表现都欠佳的情况。一个欠拟合的机器学习模型不是一个良好的模型并且在训练数据上表现不好这是显而易见的。图 ...

2020-07-08

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】数据驱动增长：三大行业A/B测试落地案例 ...

【CDA干货】解密LSTM预测结果：为何有时相同，有时 ...

描述性统计：CDA数据分析师的“数据透视镜” ...

【CDA干货】从杂乱到清晰：无序数据点的系统分析方 ...

【CDA干货】MySQL查询阻塞在query end状态：排查与 ...

CDA数据分析师：用透视分析方法，让表结构数据秒变 ...

【CDA干货】分布的“性格”：正态与偏态如何左右统 ...

【CDA干货】一次查500条vs5次查100条：数据查询的压 ...

CDA数据分析师：借表结构数据特征，解锁业务洞察密 ...

【CDA干货】Power BI热力图实战指南：让数据“温度 ...

业务数据分析师的三级进阶指南：从执行到战略 ...

CDA数据分析师：玩转表格结构数据，从全生命周期挖 ...

【CDA干货】pandas列标签获取全攻略：数据处理的“ ...

【CDA干货】Anaconda清华源配置全指南：告别下载慢 ...

CDA数据分析师：驾驭表格结构数据——从特征洞察到 ...

【CDA干货】大数据营销的“精准导航”：特征重要性 ...

【CDA干货】大数据营销实战：从流量捕获到价值深耕 ...

CDA数据分析师：报告呈现的艺术——让数据洞察转化 ...

【CDA干货】数据可视化核心要素：数据系列与数据标 ...

【CDA干货】Tableau滑动条：让数据动态叙事的交互核 ...