hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开
从今天开始不熬夜
4天前
Linux,全称GNU/Linux,是一种免费使用和自由传播的类UNIX操作系统,其内核由林纳斯·本纳第克特·托瓦兹于1991年10月5日首次发布,它主要受到Minix和Unix思想的启发,是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定
从今天开始不熬夜
4天前
• Oracle:运行稳定、可移植性高、功能齐全、性能超群,适用于大型企业 • DB2:速度快、可靠性好、适用于海量数据、恢复性极强,适用于大中型企业• MySQL:开源、体积小、速度快,适用于中小型企业 • SQL server:全面高效、界面友好易操作,但是不跨平台,适用于中小型企业
从今天开始不熬夜
2022-08-06
1.浏览量PV:页面浏览量或点击量Page View,用户每打开一个网页就记录1次PV,用户多次访问同 一页面PV累计多次。 2.访客数UV:访问页面的独立访客Unique Visitor,用户访问该页面的一台电脑客户端为一个访客, 以浏览器的cookie为依据,同一个用户多次访问只计算一个UV。 3.人均浏览量PV/UV:平均每个独立访客的浏览次数,体现网站对用户的吸引程度。
从今天开始不熬夜
2022-08-06
探索目标:每日不同时段流量走势,质量如何?用户行为转化情况怎样?如何提高留存、增加复购?如 何判断高价值用户,针对不同用户如何进行个性化营销?分析思路:1.流量指标分析:对比每日每小时的PV(访问量)、UV(访客数)、平均访问量(PV/UV),在不 同时间发布不同的营销活动,寻找更优质的拉新渠道。2. 行为转化分析:统计用户不同行为的转化情况,简化交易流程,提高转化率。3. 产品贡献定量分析:根据
从今天开始不熬夜
2022-08-06
企业中,Linux服务器通常位于远程机房中,用户不方便直接在机房操作;.可以使用支持SSH协议的软件,通过远程登录操作访问服务器,并且SSH协议可以实现对传输内容的加密.
从今天开始不熬夜
1周前
SSH协议:SSH为Secure Shell的缩写,是一种网络安全协议,专为远程登录会话和其他网络服务提供安全性的协议。 在Linux中,SSH的主要用途有:用户加密实现远程登录、服务器之间的免密登录。 SSH协议默认采用RSA算法实现非对称加密,需要两个密钥:公开密钥(public key:简称公钥)和私有密钥( private key:简称私钥)。 公钥与私钥是一对,如果用公钥对数据进行加密
从今天开始不熬夜
1周前
FinalShell连接Linux时,配置windows上的hosts映射文件,hosts文件路径:C:\Windows\System32\drivers\etc\hosts,将192.168.88.151 node1 192.168.88.152 node2 192.168.88.153 node3放入hosts时,一般会提示无管理员权限,无法更改,此时,将hosts文件拖到桌面 在桌面上更改完
从今天开始不熬夜
1周前
动态窗口函数:first_value() / last_value()/nth_value()/聚合函数用于开窗 如没有指定排序和滑动窗口范围,默认计算的是分区内的所有记录。 指定分区和排序后,如没有指定滑动窗口范围,默认计算的是分区内的第一行到当前行。静态窗口函数:row_number() / rank() / dense_rank()/percent_rank() / cume_dist()/
从今天开始不熬夜
1周前
开窗函数的一个概念是当前行,当前行属于某个窗口,窗口由 over关键字用来指定函数执行的窗口范围,如果后面括号中什么都不写,则意味着窗口包含满足where 条件的所有行,开窗函数基于所有行进行计算;如果不为空,则有三个参数来设置窗口:partition by子句:按照指定字段进行分区,两个分区由边界分隔,开窗函数在不同的分区内分别 执行,在跨越分区边界时重新初始化。 order by子句:按照指定
从今天开始不熬夜
1周前
开窗函数和普通聚合函数的区别:聚合函数是将多条记录聚合为一条;而开窗函数是每条记录都会执行,有几条记录执行完还是几 条。 聚合函数也可以用于开窗函数中。
从今天开始不熬夜
1周前
MySQL从8.0开始支持开窗函数,开窗函数是在满足某种条件的记录集合上执行的特殊函数,对于每条记录都要在此窗口内执行函数。开 窗函数的本质还是聚合运算,只不过它更具灵活性,它对数据的每一行,都使用与该行相关的行进行计 算并返回计算结果。
从今天开始不熬夜
1周前
子查询虽然很灵活,但是执行效率并不高。执行子查询时,MySQL需要为内层子查询的查询结果建立一 个临时表,然后外层主查询在临时表上进行查询和筛选。查询完毕后再撤销这些临时表,这里多了一个 创建和销毁临时表的过程。因此,子查询的速度会受到一定的影响,如果查询的数据量比较大,这种影响就会随之增大。
从今天开始不熬夜
1周前
MYSQL中子查询出现的位置,1.出现在select子句中:将子查询返回结果作为主查询的一个字段或者计算值(标量子查询、列子查询)2.出现在where/having子句中:将子查询返回的结果作为主查询的条件(标量子查询、行子查询、列子查询、表子查询)3.出现在from或join子句中:将子查询返回的结果作为主查询的一个表(标量子查询、行子查询、列子查询、表子查询)
从今天开始不熬夜
1周前
多表连接的结果通过三个属性决定: •方向性:在外连接中写在前边的表为左表、写在后边的表为右表 • 主附关系:主表要出所有的数据范围,附表与主表无匹配项时标记为null,内连接时无主附表之分
从今天开始不熬夜
1周前