291294878

2018-10-25   阅读量: 632

大数据 Hive

Hive数据仓库于数据库的异同

扫码加入数据分析学习群

(1)由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库。其实从结构上来看,Hive和数据库除了拥有类似的查询语言,

再无类似之处

(2)数据存储位置。 hdfs raw local fs

(3)数据格式。 分隔符

(4)数据更新。hive读多写少。Hive中不支持对数据的改写和添加,所有的数据都是在加载的时候中确定好的。INSERT INTO … VALUES添加数据,使用UPDATE … SET修改数据 不支持的HDFS 一次写入多次读取

(5) 执行。hive通过MapReduce来实现的 而数据库通常有自己的执行引擎。

(6)执行延迟。由于没有索引,需要扫描整个表,因此延迟较高。另外一个导致Hive执行延迟高的因素是MapReduce框架

(7)可扩展性

(8)数据规模。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
9.7428 1 4 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子