cda

数字化人才认证

大数据时代最该关心的事儿-CDA数据分析师官网

首页 > 大数据时代

剧版“浪姐”口碑爆了!数据告诉你,《三十而已》凭什么这么戳中观众的心

剧版“浪姐”口碑爆了!数据告诉你,《三十而已》凭什么这么戳中观众的心
2020-07-28
CDA数据分析师 出品 作者:Mika 数据:真达 后期:泽龙 【导读】 最近《三十而已》这部剧频频霸占微博热搜,今天我们就来聊一聊。 Python技术部分请直接看第四部分。 Show me data ...

教你用OpenCV简单快速实现图片的批量裁剪

教你用OpenCV简单快速实现图片的批量裁剪
2020-07-27
小编最近在网上下载了一批素材图片需要批量裁剪,这可难住小编了,一张张来做的话,那可得弄到猴年马月了。这时有小伙伴给推荐了一款神器:OpenCV。据说小伙伴说,他们做图像处理,经常会需要大批量的修改图片尺寸 ...

你知道如何用python来处理EXCEL表格吗?

你知道如何用python来处理EXCEL表格吗?
2020-07-27
大家在工作和生活中经常会遇到处理EXCEL表格的时候,例如将一个EXCEL表格中的内容处理之后复制到另外一个EXCEL表格之中,或者大批量处理EXCEL,无论是哪种情况,如果我们不借助工具,自己一条条去处理的话,估计要 ...

评估机器学习模型的指标:召回率,精确率和F值

评估机器学习模型的指标:召回率,精确率和F值
2020-07-27
机器学习中、完成建模之后,我们需要对模型的效果做评价,而召回率、精确率和F值就是评估机器学习模型的三大重要指标。 一、基本概念 True Positive(真正,TP):将正类预测为正类数 True Negative(真负, ...

屠杀机器人和无处不在的监控:AI是我们最大的生存威胁?

屠杀机器人和无处不在的监控:AI是我们最大的生存威胁?
2020-07-27
导读:几十年来,人工智能(artificial intelligence,AI)一直是学术界的白日梦。计算机可以像人类一样学习的想法似乎是不可能的。 随着处理能力成本的大幅下降,科学家们终于发现了如何编写和实现人工智能程 ...

python 为什么不支持 i++ 自增语法,不提供 ++ 操作符?

python 为什么不支持 i++ 自增语法,不提供 ++ 操作符?
2020-07-27
文章来源:Python猫 作者:豌豆花下猫 在 C/C++/Java 等等语言中,整型变量的自增或自减操作是标配,它们又可分为前缀操作(++i 和 --i)与后缀操作(i++ 和 i--),彼此存在着一些细微差别,各有不同 ...

想从事大数据行业,报什么专业比较好

想从事大数据行业,报什么专业比较好
2020-07-27
文章来源:接地气学堂微信公众号 作者:陈老师 又到一年高考时,又要填志愿,很多人问:“想从事大数据行业的话,报什么专业比较好???”刚好一些同学也有类似问题,今天系统解答一下 直观感 ...

机器学习中最小二乘法是什么,如何实现?

机器学习中最小二乘法是什么,如何实现?
2020-07-24
最小二乘法,相信大家都不陌生,统计学中很是常见,而且其理论相对简单,用途也很广泛。今天小编就给大家具体介绍一下最小二乘法。 一、最小二乘概念 最小二乘,或者也可以叫做最小平方和,它目的就是通过最 ...

解决交通拥堵、监测核辐射、野外搜救…无人机将有哪些神应用?

解决交通拥堵、监测核辐射、野外搜救…无人机将有哪些神应用?
2020-07-24
导读:随着应用的不断发展,无人机市场有望迅速发展。本节的目的是概述自主飞行技术的广泛潜在应用:灾难响应、事故监测(安全保障)、搜索和救援等。 作者:雅斯米娜·贝索伊·塞班(Yasmina Bestaoui Sebbane ...

SQL日志太大?教你一键清理

SQL日志太大?教你一键清理
2020-07-24
结构化查询语言,也就是Structured Query Language,简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。由于其语言简洁,易学易用,在数据分 ...

python 为了提升性能,竟运用了共享经济

python 为了提升性能,竟运用了共享经济
2020-07-24
现在各行各业可是都掀起了一股python学习的热潮,几乎每位职场人士都在学习和使用python。python大家都很熟悉了,共享经济大家也都知道,可是python运用了共享经济这件事你了解吗?想知道的话,就来看小编今天跟大 ...

数据工程师需要掌握的18个python库

数据工程师需要掌握的18个python库
2020-07-24
python之所以这么火,是因为它的应用广泛,之所以应用广泛,是因为它包含有许多功能强大的库。对于不是专业数据分析人员的我们,平时在工作和生活中,主要是用python来获取信息,制作可视化报表,但是专业的数据工 ...

数据分析师,如何打造人见人爱的数据产品

数据分析师,如何打造人见人爱的数据产品
2020-07-24
文章来源:接地气学堂 作者:接地气的陈老师 上一篇《数据分析师的绩效,该如何考核?》引发同学们很大反响。很多同学表示:我明明做了BI,可为啥体现不了业绩,甚至平时看报表的人都不多。搞得领导天天 ...

经典聚类算法Kmeans的基本原理及实现

经典聚类算法Kmeans的基本原理及实现
2020-07-24
Kmeans算法,又叫做K均值聚类算法,可以说是无监督聚类算法中最具代表性,最经典的聚类算法了,这一算法的主要作用是将相似的样本自动归到一个类别中。小编特意整理了这一经典聚类算法的基本原理供大家参考,希望 ...

无监督机器学习中,这几种聚类算法,你知道吗?

无监督机器学习中,这几种聚类算法,你知道吗?
2020-07-24
机器学习中,我们最常遇到的就是无监督,有监督,半监督了。无监督和有监督的区别,小编之前跟大家分享过,今天跟大家分享的是无监督机器学习中常见的聚类算法,希望对大家无监督学习有所帮助。 一、基本概念 ...

KNN最近邻算法原理是什么?如何实现?

KNN最近邻算法原理是什么?如何实现?
2020-07-24
把近朱者赤,近墨者黑这一思想运用到机器学习中会产生什么?当然是KNN最邻近算法啦!KNN(全称K-Nearest Neighbor)最邻近分类算法是数据挖掘分类算法中最简单的算法之一,白话解释一下就是:由你的邻居来推断出你的类 ...

数据清洗之python实现缺失值处理

数据清洗之python实现缺失值处理
2020-07-24
在实际的数据清洗过程中,我们经常会遇到数据内容丢失的情况,这些丢失的数据内容就是缺失值。缺失值的产生的原因多种多样,主要分为机械原因和人为原因。 机械原因,也就是由于例如,数据存储失败,存储器损坏 ...

朴素贝叶斯算法的优缺点是什么?如何实现?

朴素贝叶斯算法的优缺点是什么?如何实现?
2020-07-24
在文本分类,垃圾邮件过滤的场景中,我们经常会用到的是朴素贝叶斯算法,今天小编就具体给大家介绍一下朴素贝叶斯算法 一、朴素贝叶斯算法简介 1.朴素贝叶斯算法概念 朴素贝叶斯法是基于贝叶斯定理与特征 ...

一文带你快速了解机器学习中的多元线性回归到底是什么?

一文带你快速了解机器学习中的多元线性回归到底是什么?
2020-07-24
线性回归我们都很熟悉了,是有监督学习中最为简单的一种回归方式,小编今天就进一步跟大家分享一下多元线性回归。 一、什么是多元线性回归 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。线 ...

如何简单通俗的理解交叉熵损失函数?

如何简单通俗的理解交叉熵损失函数?
2020-07-24
前面小编给大家简单介绍过损失函数,今天给大家继续分享交叉熵损失函数,直接来看干货吧。 一、交叉熵损失函数概念 交叉熵损失函数CrossEntropy Loss,是分类问题中经常使用的一种损失函数。公式为: ...

OK