CDA数据科学研究院 CDA考试中心 CDA人工智能学院 企业服务 关于CDA

cda

全国校区

首页 > 大数据时代

python数据清洗时,经常用到的工具有哪几种?
2020-07-06
数据清洗是整个数据分析过程的第一步,也是整个数据分析项目中最耗费时间的一步,下面小编整理了几种常用的python数据清洗工具,希望对大家有所帮助。 目前在python中, numpy和pandas是最主流的数据清洗工具,N ...
常用的python缺失值处理方法有哪几种?
2020-07-06
缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。 python缺失的处理一般情况下有三种方法: (1)删掉缺失值数据 删除法是 ...

pandas缺失值的填补方法——fillna

pandas缺失值的填补方法——fillna
2020-07-06
在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介 ...

关于numpy概念的简单理解

关于numpy概念的简单理解
2020-07-06
numpy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、 ...

入门小白的python的安装教程

入门小白的python的安装教程
2020-07-06
1、打开python的官网:https://www.python.org/downloads/windows/,选择Downloads,并选择需要的版本。 2、安装 (1)勾选Add PythonXXto PATH是把Python的安装路径添加到系统环境变量的Path变量中 ...
pandas模块的数据结构有哪几种?
2020-07-06
pandas 是 Python 的外部模块,基于NumPy ,是为了解决数据分析任务而创建的,对数据挖掘前期数据的处理工作十分有用。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,而且纳入了大量库和一些标准的数 ...
数据建模是什么意思?在创建过程中需要注意什么?
2020-07-06
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。 在数据分析与挖掘中,我们通常需要根据一些数据建立起特定的模型,然后处理。模型的建立需要 ...
这几款好用的BI分析工具,你pick哪一个?
2020-07-06
进行商业分析时,自然少不了BI分析工具的应用,小编今天就整理了一些常用的BI分析工具,供大家参考。 1.tableau tableau是目前市面上较为成功的BI分析工具。产品既有针对性,又有普适性。拖放式界面,操作简 ...

最实用的数据管理及可视化工具——tableau

最实用的数据管理及可视化工具——tableau
2020-07-06
说到数据管理和数据可视化工具,往往大家第一个想到的就是tableau。tableau是用来做数据的管理和数据可视化的工具,致力于帮助人们查看并理解自己的数据,可以说是在数据分析工具中最好用的数据管理及可视化软件, ...

powerBI是一款什么工具?能帮助我们干什么?

powerBI是一款什么工具?能帮助我们干什么?
2020-07-06
powerBI 是微软新一代商业分析工具,用于在组织中提供见解。能够根据filter条件,对数据执行动态筛选,从不同的角度和粒度上分析数据;可连接数百个数据源、简化数据准备并提供即席分析;能够把相关的静态数据转换为 ...

机器学习中的泛化能力指的是什么?

机器学习中的泛化能力指的是什么?
2020-07-03
概括地说,泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据对背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为 ...

集成学习是什么?有哪些分类?

集成学习是什么?有哪些分类?
2020-07-03
今天小编给大家带来的是现在非常火爆的机器学习方法——集成学习。集成学习,顾名思义,通过将多个单个学习器集成/组合在一起,使它们共同完成学习任务,有时也被称为“多分类器系统(multi-classifier system)”、 ...

逻辑回归(Logistic Regression)有哪些优缺点?

逻辑回归(Logistic Regression)有哪些优缺点?
2020-07-03
逻辑回归也是机器学习中常见的一种学习方法,今天我们就来看一看逻辑回归的优缺点。 逻辑回归(Logistic Regression)是一种有监督的统计学习方法,主要用于对样本进行分类。逻辑回归是机器学习中做分类任务常用 ...

常见的机器学习中损失函数有哪些?

常见的机器学习中损失函数有哪些?
2020-07-03
今天我们来盘点一下那些常见的机器学习中的损失函数有哪些。 用于计算损失的函数称为损失函数。模型每一次预测的好坏用损失函数来度量。机器通过损失函数进行学习,如果预测值与实际结果偏离较远,损失函数会得 ...

线性可分支持向量机、线性支持向量机、非线性支持向量机的区别有哪些

线性可分支持向量机、线性支持向量机、非线性支持向量机的区别有哪些
2020-07-03
支持向量机是一种二类分类模型.它的基本模型是定义在特征空间上的间隔最大的线性分类器。其学习策略是间隔最大化,可形式化为求解凸二次规划问题,也等价于正则化的合叶损失函数的最小化问题。 支持向量机学习 ...
SVM和LR有哪些相同点和不同点
2020-07-03
SVM和LR是机器学习中常用的算法,今天就让我们来看一下这两者有哪些相同点和不同点吧。 SVM和LR的相同点: 1.LR和SVM都是有监督的学习 2.LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在 ...
SVC,NuSVC,LinearSVC有什么区别
2020-07-03
相信大家在机器学习中,一定常见到;SVC,NvSVC,LinearSVC,今天我们就来看看这三者的区别。 SVC(C-Support Vector Classification): 支持向量分类,基于libsvm实现的,数据拟合的时间复杂度是数据样本的二 ...

支持向量机SVM 概念及特征介绍

支持向量机SVM 概念及特征介绍
2020-07-03
支持向量机SVM(Support Vector Machine),是常见的一种判别方法。在机器学习领域,是有监督学习模型,通常用来进行模式识别、分类及回归分析,主要针对小样本数据进行学习、分类和预测,类似的根据样本进行学习的 ...

PCA降维原理(主成分分析)的数学理论

PCA降维原理(主成分分析)的数学理论
2020-07-03
在机器学习中,有成千上万甚至几十万的维度的数据需要处理,这种情况下机器学习的资源消耗是不可接受的,并且很大程度上影响着算法的复杂度,因此对数据降维是必要的。PCA(Principal Component Analysis)是一种常 ...
python常用内置函数整理—反射
2020-07-03
函数是组织好的,能够重复使用的,用来实现单一,或相关联功能的代码段。python提供了许多内建函数,这些函数提高了应用的模块性,和代码的重复利用率。下面是小编整理的python内建函数中的反射类,希望对各位学习 ...

OK