cda

数字化人才认证

首页 > 行业图谱 >

如何对机器学习xgboost中数据集不平衡进行处理?
2023-04-18
机器学习是一种利用算法和模型从数据中自动学习的方法,而不需要明确编程。随着技术的发展,机器学习在解决各种问题方面得到了广泛的应用。但是,在实际应用中,我们会遇到一个常见的问题:不平衡的数据集。 由于某 ...
机器学习算法中 GBDT 和 XGBOOST 的区别有哪些?
2023-03-22
Gradient Boosting Decision Tree (GBDT) 和 Extreme Gradient Boosting (XGBoost) 都是目前机器学习领域中非常流行的算法。两种算法都采用了 boosting 方法来提高分类或回归效果,但在实现细节上还是有一些区别的 ...

当 机器学习 遇到数据量不够时,这几个Python技巧为你化解难题

机器学习遇到数据量不够时,这几个Python技巧为你化解难题
2022-06-01
作者:俊欣 有时候我们在进行模型的训练与优化的时候,是需要基于现有的数据集来操作的,要是数据量比较充足的情况下倒是还好说,但是要是遇到数据量不够的情况,该怎么办呢?今天小编就给大家来介绍几个方法 ...

当 机器学习 遇到数据量不够时,这几个Python技巧为你化解难题

机器学习遇到数据量不够时,这几个Python技巧为你化解难题
2022-06-01
作者:俊欣 有时候我们在进行模型的训练与优化的时候,是需要基于现有的数据集来操作的,要是数据量比较充足的情况下倒是还好说,但是要是遇到数据量不够的情况,该怎么办呢?今天小编就给大家来介绍几个方法 ...

Python实现 机器学习 前后端页面的交互

Python实现机器学习前后端页面的交互
2022-04-01
作者: 俊欣 来源:关于数据分析与可视化 对于机器学习爱好者而言,很多时候我们需要将建好的模型部署在线上,实现前后端的交互,今天小编就通过Flask以及Streamlit这两个框架实现机器学习模型的前后端交互 ...
超越回购:GitHub促进人工智能和机器学习领域的职业发展
2022-03-14
作者:PerceptiLabs联合创始人兼首席执行官马丁·伊萨克森。 长期以来,版本控制工具一直是信息工作者的主要工具,尤其是那些需要在代码库上存储和协作的地方,同时维护完整的更改历史的开发人员。 多年 ...
从软件到机器学习工程师的旅程
2022-03-14
我已经在iZettle工作了大约四年了。我在这家公司的旅程并不是以机器学习工程师的身份开始的,而是随着我在公司的成长而过渡到机器学习工程师。 我的正规教育是计算机科学/软件工程,事实上我已经做了大 ...
在数据科学和机器学习方面,我的收入翻了一番
2022-02-28
我只想在前言中说,这篇文章更多地反映了我是如何走到今天的。我并不是说你会通过遵循同样的步骤来实现同样的事情,但我认为这可能会为你提供一个独特的视角,这是你以前可能没有想过的。 说到这里,让我们 ...
关于机器学习的常见误解
2022-02-21
有一个关于ML(机器学习)的炒作列车正在进行,许多初学者正成为这个炒作列车的受害者,因为他们是因为错误的原因进入的。你的教授会解释如何获得博士学位。如果你想变得更好,或者你的同行告诉你如何获得更好 ...
如何战胜机器学习工程师冒名顶替综合症
2022-02-21
语境 当我第一次申请l时,我想同时成为一名自由职业者和一名“真正的ML工程师”。 在此之前,我在Nordeus担任机器学习工程师,Nordeus是一家顶级移动游戏公司,以其旗舰游戏TopEleven上有穆里尼奥的脸而 ...
如何学习机器学习的数学知识
2022-02-16
分享  数据科学有志之士最常见的问题之一是  行业中的守门人对这种担忧没有帮助,他们给学生贴上了不合格的标签,除非他们拥有该学科的硕士或博士学位。  那么,为了在数据科学行业 ...

Python实现基于 机器学习 的RFM模型

Python实现基于机器学习的RFM模型
2022-01-27
CDA数据分析师 出品 岗位:数据分析师 背景 如今新基建大数据、人工智能行业在迅速的发展,而机器学习是其中不可或缺的一环,机器学习强调的是利用人脑一般从历史的数据中学习到经验并运用与未来的 ...

解读 | 数据工程、数据科学和 机器学习 都有什么区别?

解读 | 数据工程、数据科学和机器学习都有什么区别?
2021-12-09
CDA数据分析师 出品 作者:Darshil Parmar 编译:Mika 【导读】 数据科学、机器学习和数据工程到底有什么区别?本文带你看懂。 数据科学是一个广泛的领域。 因为它是如此的多样化,我们很难 ...

Pandas/Sklearn进行 机器学习 之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

如何评估 机器学习 模型的商业价值

如何评估机器学习模型的商业价值
2021-09-22
作者:amitvkulkarni CDA数据分析师编译 概述 对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程 ...

 机器学习 如何应用于商业场景?三个真实的商业项目

机器学习如何应用于商业场景?三个真实的商业项目
2021-09-16
在国富如荷这些年的教学过程中,很多同学问到了一个问题: 在现实的商业世界中如何应用机器学习? 也就是说,虽然现在我们一直被各种算法文章和教程轰炸,但是关于企业中一个机器学习项目的“上下文”却 ...

牛津大学科普 | 几分钟带你了解:什么是 机器学习

牛津大学科普 | 几分钟带你了解:什么是机器学习
2021-03-22
CDA数据分析师 出品 编译:Mika 【导读】 如今机器学习已经深入到我们生活的方方面面,它就在我们身边,在我们的手机上,社交网络上...但它是如何工作的呢?在本文中,牛津大学针对机器学习进行 ...

CDA LEVEL 1 考试,知识点《 机器学习 基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2021-03-15
一、什么是机器学习 机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 一个计算机程序在完成了任务T之后,获得经验E,其表现效果为P,如 果任务T的性能表现,也就是用 ...

 机器学习 还能预测心血管疾病?没错,我用python写出来了

机器学习还能预测心血管疾病?没错,我用python写出来了
2020-09-07
CDA数据分析师 出品   作者:Mika 数据:真达   后期:Mika 【导读】手把手教你如何用python写出心血管疾病预测模型。 全球每年约有1700万人死于心血管疾病,当中主要表现 ...

 机器学习 三要素

机器学习三要素
2018-08-26
机器学习三要素 通过对机器学习探索,发现其实无论用什么方法想要达到什么目的,其最终都是要求的一个能对新数据进行预测的公式,该公式可能是以概率的形式出现,即P(Y|X);也可能是以函数的形式出现,即y=f( ...

OK