cda

数字化人才认证

首页 > 行业图谱 >

机器学习python应用,简单机器学习项目实践!

机器学习python应用,简单机器学习项目实践!
2020-05-25
上一篇文章中介绍了机器学习的简单知识,还有python中进行机器学习实践需要的生态环境,接下来将会通过鸢尾花分类这个例子对机器学习做一个简要的介绍。通过一步一步地实现这个项目来介绍以下内容。 导入和 ...

如何用python预测“命定的那个TA”什么时候住酒店?

如何用python预测“命定的那个TA”什么时候住酒店?
2020-05-25
作者:野水晶体  来源:livandata 看到这个题目,大家是否会有一些小小的想法?别闹了!笔者是一个正经人,讨论的也是一个有关python的技术问题,哈哈~ 每个人的行为都是有迹可循的,这些 ...

数据管理框架中的元数据管理是什么?

数据管理框架中的元数据管理是什么?
2020-05-14
大数据时代下,凭借数据管理框架中的重要管理职能,元数据管理也越来越频繁的出现在大家的视野中。 元数据及应用也是数据仓库的重要组成部分,它是描述数据的数据(data about data),描述数据的属性信息,可以帮助 ...

Mapreduce的主要功能有哪些?

Mapreduce的主要功能有哪些?
2020-05-13
Mapreduce是种编程模型,结合了概念\"Map(映射)\"和\"Reduce(归约)\",用于大规模数据集(大于1TB)的并行运算。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统 ...

Apache Flink是什么?

Apache Flink是什么?
2020-05-13
Flink其实就是Apache Flink,是一款业内非常火的大数据产品,由Apache软件基金会开发,核心是用Java和Scala编写的分布式流数据流引擎。Apache Flink是个旨在提供‘一站式’ 的分布式开源数据处理框架。 ...

kudu是什么意思?

kudu是什么意思?
2020-05-12
Kudu是一个列式存储的用于快速分析的NoSQL数据库,提供了类似SQL的查询语句,与RDBMS十分类似,有**PRIMARY KEY **,基于主键查询而不是HBase的RowKey。 kudu拥有毫秒级延迟 与其他大数据数据库不同,Kud ...

决定企业生存的二八原理:长尾分布

决定企业生存的二八原理:长尾分布
2020-05-11
统计分析中的长尾分布理论认为,由于成本和效率的因素,过去人们只会关注重要的人或事,如果用需求曲线来描述,受精力与成本等客观因素的限制,人们通常只会关注曲线的“头部”,而选择忽略曲线的“尾部 ...

怎么样建立起用户画像?

怎么样建立起用户画像?
2020-05-09
很多企业在营销的时候会提到“用户画像”,那用户画像究竟是什么呢? 其实用户画像就是用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出 ...

千亿数据优化,如何绕过数据倾斜这头拦路虎?

千亿数据优化,如何绕过数据倾斜这头拦路虎?
2020-04-21
作者:dantezhao 前言: 数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎。 迈的过去,将 ...

一文读懂非关系型数据库(NoSQL)

一文读懂非关系型数据库(NoSQL)
2020-04-20
NoSQL(NoSQL = Not Only SQL ),意即\"不仅仅是SQL\"。 现代计算系统每天在网络上都会产生庞大的数据量。这些数据有很大一部分是由关系型数据库管理系统(RDBMSs)来处理,其严谨成熟的数学理 ...

主数据的3大特征、4个超越和3个二八原则

主数据的3大特征、4个超越和3个二八原则
2020-04-17
作者 | 石秀峰 导读:主数据(Master Data)是具有共享性的基础数据,可以在企业内跨越各个业务部门被重复使用的,因此通常长期存在且应用于多个系统。由于主数据是企业基准数据,数据来 ...

为何Python技能越来越受到企业的青睐?

为何Python技能越来越受到企业的青睐?
2020-04-13
想要在职场中站稳脚步,掌握一门硬技术是非常重要的事情。顺应时代发展,抓住新的机遇,在如今市场经济不景气的2020年显得尤为重要。数数当下比较热门或高涨的行业,当属数据分析和人工智能 ...

Excel数据分析系列(一):Excel的前世今生

Excel数据分析系列(一):Excel的前世今生
2020-04-10
作者 | CDA数据分析师 Excel的前世 世界上第一款电子表格——VisiCalc “数百年来,人们用的都是手写表格,在1978年初,我开始着手实现一个想法,最终这个想法 ...

转行还是得趁早——数据分析师职场图鉴,全方位为您梳理

转行还是得趁早——数据分析师职场图鉴,全方位为您梳理
2020-04-09
随着大数据和人工智能时代的到来,传统企业开始向数据化和智能化转型。由此,数据分析师相关岗位的需求量逐年递增,近两年呈现出供不应求的状况,在未来很长一段时间这种需求还将继续保持下去。作为过 ...

有关数据爬取的三大法律案件

有关数据爬取的三大法律案件
2020-04-08
出品 | CDA数据分析师 在当下大数据时代,数据具有非常大的价值,许多企业都需要使用它,无论是以商用形式还是非商用形式。而Web抓取是最常见的数据获取方式之一,Web抓取使用漫游器 ...

通过定量数据构建用户画像的方法与流程

通过定量数据构建用户画像的方法与流程
2020-04-03
作者 | CDA数据分析师 前言 用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。用户画像最初是在电商领域得到应 ...

从5个维度出发,构建高质量的用户画像

从5个维度出发,构建高质量的用户画像
2020-04-03
作者 | CDA数据分析师 如果说有什么 能力是产品经理最需要具备的核心能力,那么答案一定是“了解用户”,而要说如何体现产品经理对用户了解的程度,那一定是能输出一份合格的用户画 ...

AI、机器学习、数据科学与深度学习研究在2020年的发展趋势(二)

AI、机器学习、数据科学与深度学习研究在2020年的发展趋势(二)
2020-04-03
作者 | Matthew Mayo 编译 | CDA数据分析师 在2019年(及之前的几年)中,我们询问了许多顶级专家,2019年和2020年AI,分析,机器学习,数据科学和深度学习领域最重要的发展趋势 ...

AI、机器学习、数据科学与深度学习在2020年的主要发展趋势(一)

AI、机器学习、数据科学与深度学习在2020年的主要发展趋势(一)
2020-04-02
作者 | Matthew Mayo 编译 | CDA数据分析师 正如我们告别上一年并期待新的一年一样,KDnuggets再次征求了众多研究和技术专家对2019年最重要的发展及其2020年关键趋势预测的意见 ...

2019年影响数据科学的十大技术趋势

2019年影响数据科学的十大技术趋势
2020-04-01
作者 | CDA数据分析师 本文概述了2019年10种影响数据科学的最流行的技术,该列表涵盖了多种主题,例如安全性,物联网,强化学习,能源可持续性,智慧城市等等。 又到了一年回顾 ...

OK
客服在线
立即咨询