CDA数据科学研究院 CDA考试中心 CDA人工智能学院 企业服务 关于CDA

cda

全国校区

首页 > 行业图谱 > Hive

Hbase是什么?与Hive有哪些区别?
2020-07-14
HbaseE是一个具有高可靠性、高性能特点、面向列、可伸缩的分布式存储系统。利用Hbase技术能够在廉价PC Server上搭建起大规模结构化存储集群。Hbase的目标为:存储并处理大型的数据。更进一步说就是仅需通过普通的 ...

<font color=Hive基本介绍及安装应用方法" class="wztu">

Hive基本介绍及安装应用方法
2020-07-14
Hive是一款基于Hadoop的数据仓库工具,通常被用于数据提取、转化、加载,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive最大的优点是学习成本低, ...

大数据之<font color=HiveSQL安装配置!" class="wztu">

大数据之HiveSQL安装配置!
2020-05-14
hive默认将元数据存储到本地内嵌的Derby数据库中,但是Derby不支持多会话链接,因此我们使用mysql数据库来存储hive的元数据。配置完成hiveSQL的元数据库之后再开始安装、配置hive。 1、在线安装mysql ...

Hadoop+<font color=Hive常用知识总结" class="wztu">

Hadoop+Hive常用知识总结
2017-05-24
Hadoop+Hive常用知识总结 1、什么是Hadoop?什么是hive? Hadoop:一个分布式系统基础架构,由Apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力告诉运算和存 ...

Hadoop数据倾斜产生的原因是什么?如何进行处理?

Hadoop数据倾斜产生的原因是什么?如何进行处理?
2020-07-20
大数据处理时我们经常会遇到数据倾斜的问题,尤其是在数据量过大时,数据倾斜可能会导致各种各样的问题。Hadoop数据倾斜主要表现为:ruduce阶段卡在99.99%,而且是一直99.99%不能结束。 具体来说就是:mapreduc ...

数据分析认证证书,为啥成了香饽饽?百度搜不到的答案来了!

数据分析认证证书,为啥成了香饽饽?百度搜不到的答案来了!
2020-07-20
2020年是特殊的一年,突如其来的疫情,阻断了全球经济高速发展的步伐,很多城市经济陷入低迷。同样,对很多人而言,2020年亦是充满机遇的一年。 古有云:时势造英雄。在遭遇重大危机时,安于现状者无法独善其身 ...

数据分析师的发展方向有哪几方面?

数据分析师的发展方向有哪几方面?
2020-06-30
数据分析行业大火,很多小伙伴都想转行成为数据分析师,入行容易,但重要的需要确定未来的一个发展方向,不能盲目入行。下面小编给大家分享几种数据分析师的发展方向,大家可以参考一下,首先确定好自己的目标。 ...
CDA大数据分析师的报考条件是什么,任何人都可以报考吗?
2020-06-29
“CDA数据分析师认证”是一套专业化,科学化,国际化,系统化的人才考核标准,分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ。其中CDA Level II大数据分析师,指政府、金融、电信、零售、互联网、电商、医学等行业专门从 ...

400多项职业资格证被取消,究竟怎样的资格证不容易被取代?

400多项职业资格证被取消,究竟怎样的资格证不容易被取代?
2020-06-28
为减轻各类人才和用人单位的负担,降低社会就业创业的门槛,国务院分7批取消了职业资格许可和认定事项共400多项,涉及专业技术人员职业资格154项,技能人员职业资格280项。 部分取消的名单 连国际金融理 ...

从Hadoop到ClickHouse,现代BI系统有哪些问题?如何解决?

从Hadoop到ClickHouse,现代BI系统有哪些问题?如何解决?
2020-06-24
导读:一次机缘巧合,在研究BI产品技术选型的时候,我接触到了ClickHouse,瞬间就被其惊人的性能所折服。这款非Hadoop生态、简单、自成一体的技术组件引起了我极大的好奇。那么ClickHouse好在哪呢?本文带你做一个 ...

CDA数据分析师的考核能力的标准是什么

CDA数据分析师的考核能力的标准是什么
2020-06-22
CDA(Certified Data Analyst),亦称“CDA数据分析师”,指在互联网、零售、金融、电信、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据分析人才。“CDA数据分析师认 ...

sparkSQL和spark有什么区别?

sparkSQL和spark有什么区别?
2020-05-14
Spark为结构化数据处理引入了一个称为Spark SQL的编程模块。简而言之,sparkSQL是Spark的前身,是在Hadoop发展过程中,为了给熟悉RDBMS但又不理解MapReduce的技术人员提供快速上手的工具。 sparkSQL提供了一 ...

kudu是什么意思?

kudu是什么意思?
2020-05-12
Kudu是一个列式存储的用于快速分析的NoSQL数据库,提供了类似SQL的查询语句,与RDBMS十分类似,有**PRIMARY KEY **,基于主键查询而不是HBase的RowKey。 kudu拥有毫秒级延迟 与其他大数据数据库不同,Kud ...

千亿数据优化,如何绕过数据倾斜这头拦路虎?

千亿数据优化,如何绕过数据倾斜这头拦路虎?
2020-04-21
作者:dantezhao 前言: 数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎。 迈的过去,将 ...

机器学习入门必读:6种简单实用算法及学习曲线、思维导图

机器学习入门必读:6种简单实用算法及学习曲线、思维导图
2020-03-26
作者 | 卢誉声 大部分的机器学习算法主要用来解决两类问题——分类问题和回归问题。在本文当中,我们介绍一些简单但经典实用的传统机器学习算法,让大家对机器学习算法有一个基本的感性认识。 ...

当下大数据发展的 8 个要点

当下大数据发展的 8 个要点
2019-11-04
作者 | 章剑锋 笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapRedu ...

一文带你完全了解,什么是数据科学

一文带你完全了解,什么是数据科学
2019-10-15
作者 | CDA数据分析师 数据科学是一个研究领域,涉及通过使用各种科学方法,算法和过程从大量数据中提取见解。它可以帮助您从原始数据中发现隐藏的模式。 由于数理统计,数据分析和大数据的发展 ...

如何通过网络数据的获取,做出这些数据分析项目?

如何通过网络数据的获取,做出这些数据分析项目?
2019-10-10
作者 | AlfredWu 来源 | Alfred数据室 最近有很多人在问,我是如何收集网络的数据,如何进行数据处理、数据分析以及可视化呈现的。 也有人问的更具体,关于Python数据分析的一些问题。到 ...

马云所说的大数据人才,月薪高达30K

马云所说的大数据人才,月薪高达30K
2019-09-27
作者 | 王新港 出品 | CDA数据分析研究院 马云曾在卸任演讲的时候说过这样一段话: “很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数 ...

算法工程师应该具备哪些工程能力?

算法工程师应该具备哪些工程能力?
2019-09-16
作者 | 木东居士 来源 | Data_Engineering 最近看了 Milter 的《算法工程师究竟需要哪些工程能力》这篇文章,有所感想,因此也写一篇关于算法工程师的技术能力的问题,和大家分享一下居士关 ...

OK