cda

数字化人才认证

首页 > 行业图谱 >

123456 3/6
如何评估模型的预测性能?
2023-06-15
在机器学习中,评估模型的预测性能是非常重要的。因此,本文将简要介绍一些用于评估模型预测性能的常见指标和方法。 数据集划分 首先要想到的是,评估模型预测性能需要使用数据集进行测试操作。为了避免模型对已知数 ...
如何评估模型的准确性?
2023-06-15
为了评估一个模型的准确性,需要考虑多个因素。以下是一些可能有用的方法和技术: 混淆矩阵 混淆矩阵是评估分类模型的常用工具。它将实际类别与模型预测的类别进行比较,并将结果呈现在二维表格中。这种方法可以计 ...
如何评估模型的性能?
2023-06-15
在机器学习中,模型的性能评估是非常重要的一步。通过对模型性能的评估,我们可以了解模型的表现如何,并且可以根据这些表现来确定是否需要对模型进行优化或调整。本文将介绍如何评估模型性能以及评估时需要注意的事 ...
怎么用神经网络建立预测模型?
2023-04-10
神经网络是一种能够建立预测模型的强大工具,它可以通过对数据的学习和分析来预测未来事件的发生情况。在本文中,我们将探讨如何使用神经网络来建立预测模型,从而提高我们制定决策的准确性和效率。 收集数据 首先 ...
nlp序列标注任务如何处理类别极度不平衡问题?
2023-04-07
自然语言处理(NLP)中的序列标注任务涉及将一系列文本标记为特定类别。 在这种情况下,如果数据集中存在类别不平衡,则可能会影响模型的性能。 对于一个极度不平衡的数据集,即使使用优秀的机器学习算法,也可能会 ...

作为文科生,我是如何转行数据挖掘工程师的 | CDA持证人分享

作为文科生,我是如何转行数据挖掘工程师的 | CDA持证人分享
2023-10-19
大家好,今天跟大家带来一个分享,主题是关于我如何从文科生转行为数据挖掘工程师的。 第一部分讲一下我作为文科生转行数据挖掘的历程; 第二部分是关于目前从事数据挖掘,主要针对商业数据挖 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(十八)

CDA Level Ⅲ 数据分析认证考试模拟题库(十八)
2021-10-12
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的96-100题。(材料题) 不过,在出题前,要公布上一期Level Ⅲ 中91-95题的答案,大家一起来看! ...

CDA Level Ⅲ 数据分析认证考试模拟题库

CDA Level Ⅲ 数据分析认证考试模拟题库
2021-10-11
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的91-95题。(材料题) 不过,在出题前,要公布上一期Level Ⅲ 中86-90题的答案,大家一起来看! ...

如何评估机器学习模型的商业价值

如何评估机器学习模型的商业价值
2021-09-22
作者:amitvkulkarni CDA数据分析师编译 概述 对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程 ...

CDA LEVEL II 数据分析认证考试模拟题库(六)

CDA LEVEL II 数据分析认证考试模拟题库(六)
2021-04-29
嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL II的模拟试题时间了,今天给大家带来的是模拟试题(一)中的26-30题。 不过,在出题前,要公布上一期LEVEL II中6-10题的答案,大家一起来看! 21、A ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2021-03-15
一、什么是机器学习 机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 一个计算机程序在完成了任务T之后,获得经验E,其表现效果为P,如 果任务T的性能表现,也就是用 ...

CDA LEVEL 1 考试,知识点汇总《分类分析》

CDA LEVEL 1 考试,知识点汇总《分类分析》
2021-02-25
列联表和卡方检验 分类变量之间的相关性一般可以采用列联表分析或卡方检验的方法来进行验证。 列联表是两个分类变量的分类水平之间形成的交叉频数表,通过计算行百分比或列百分比,对实际频率和期望频率进行对 比 ...

CDA LEVEL I 数据分析认证考试模拟题库(二十)

CDA LEVEL I 数据分析认证考试模拟题库(二十)
2021-01-19
嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL I的模拟试题时间了,今天给大家带来的是模拟试题(二)中的16-20题。 不过,在出题前,要公布下上一期11-15题的答案,大家一起来看! 11、D 12、A ...

机器学习还能预测心血管疾病?没错,我用python写出来了

机器学习还能预测心血管疾病?没错,我用python写出来了
2020-09-07
CDA数据分析师 出品   作者:Mika 数据:真达   后期:Mika 【导读】手把手教你如何用python写出心血管疾病预测模型。 全球每年约有1700万人死于心血管疾病,当中主要表现 ...

盘点机器学习中那些神奇的损失函数

盘点机器学习中那些神奇的损失函数
2018-08-14
盘点机器学习中那些神奇的损失函数 我最近在学习R语言,但是估R语言我应该没能跟sas一样玩那么好。今天来更新在机器学习中的一些专业术语,例如一些损失函数,正则化,核函数是什么东西。 损失函数:损失函 ...
数据挖掘---分类:基本概念、决策树、与模型评估
2018-06-13
数据挖掘---分类:基本概念、决策树、与模型评估 分类:基本概念、决策树与模型评估 分类任务就是确定对象属于那个预定义的目标类。就是通过学习得到一个目标函数f,把每个属性集映射到一个预先定义的类标号y. 一 ...

R语言使用逻辑回归分类算法

R语言使用逻辑回归分类算法
2018-05-31
R语言使用逻辑回归分类算法 逻辑回归属于概率统计的分类算法模型的算法,是根据一个或者多个特征进行类别标号预测。在R语言中可以通过调用logit函数执行逻辑回归分类算法并预测输出概率。通过调用glm函数将fam ...
R语言多元分析系列
2017-07-21
R语言多元分析系列 R语言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...
R语言逻辑回归、ROC曲线和十折交叉验证
2017-07-19
R语言逻辑回归、ROC曲线和十折交叉验证 自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。 1. 测试集和训练集3、7分组 [html] view plain copy ...
R语言中样本平衡的几种方法
2017-06-07
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...
123456 3/6

OK