从今天开始不熬夜

分布式计算概念

分布式计算是一种计算方法,和集中式计算是相对的。随着计算技术的发展,有些应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费相当长的时间 来完成。分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。

从今天开始不熬夜

2022-08-09

96.4432 2 0
  • 关注作者
  • 收藏

Hadoop MapReduce

1.MapReduce的思想核心是“先分再合,分而治之”. 2.所谓“分而治之”就是把一个复杂的问题,按照一定的“分解”方法分为等价的规模较小的若干部分,然后逐个解 决,分别找出各部分的结果,然后把各部分的结果组成整个问题的最终结果.3.这种思想来源于日常生活与工作时的经验。即使是发布过论文实现分布式计算的谷歌也只是实现了这种思想,而不是自己原创.

从今天开始不熬夜

2022-08-09

96.4432 2 0
  • 关注作者
  • 收藏

Hadoop特性优点

scalability(扩容能力):Hadoop是在可用的计算机集群间分配 数据并完成计算任务的,这些集群可方 便灵活的方式扩展到数以千计的节点。Economical(成本低):Hadoop集群允许通过部署普通廉价的机器组成集群来处理大数据,以至于成本很 efficiency 低。看重的是集群整体能力。efficiency(效率高):通过并发数据,Hadoop可以在节 点之间动态并行的移动数据,使

从今天开始不熬夜

2022-08-09

96.4432 2 0
  • 关注作者
  • 收藏

hadoop含义

狭义上Hadoop指的是Apache软件基金会的一款开源软件。广义上Hadoop指的是围绕Hadoop打造的大数据生态圈。

从今天开始不熬夜

2022-08-09

96.4432 2 0
  • 关注作者
  • 收藏

Hadoop核心组件

Hadoop HDFS(分布式文件存储系统):解决海量数据存储 Hadoop YARN(集群资源管理和任务调度框架):解决资源任务调度 Hadoop MapReduce(分布式计算框架):解决海量数据计算

从今天开始不熬夜

2022-08-09

96.4432 2 0
  • 关注作者
  • 收藏

Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-c

从今天开始不熬夜

2022-08-08

96.4432 2 0
  • 关注作者
  • 收藏

unix

Unix是20世纪70年代初出现的一个操作系统,除了作为网络操作系统之外,还可以作为单机操作系统使用.UNIX系统是一个分时系统。最早的UNIX系统于1970年问世。此前,只有面向批处理作业的操作系统,这样的系统对于需要立即得到响应的用户来说是太慢了。在60年代末,Kenneth Thompson和Dennis Ritchie都曾参加过交互方式分时系统Multics的设计,而开发该系统所使用的工具

从今天开始不熬夜

2022-08-08

96.4432 2 0
  • 关注作者
  • 收藏

Minix

Minix是一种基于微内核架构的类UNIX计算机操作系统,于1987年由Andrew S. Tanenbaum教授发布,它启发了Linux。20世纪80年代,由于AT&T所有的UNIX版权的限制,荷兰的Andrew S. Tanenbaum教授决定写一个不包含任何AT&T源代码的UNIX系统,名为MINIX(即小型的UNIX),并开放全部源代码给大学教学和研究工作,Minix于2000年重新改为B

从今天开始不熬夜

2022-08-08

96.4432 2 0
  • 关注作者
  • 收藏

hive

hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开

从今天开始不熬夜

2022-08-08

96.0000 1 0
  • 关注作者
  • 收藏

Linux

Linux,全称GNU/Linux,是一种免费使用和自由传播的类UNIX操作系统,其内核由林纳斯·本纳第克特·托瓦兹于1991年10月5日首次发布,它主要受到Minix和Unix思想的启发,是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定

从今天开始不熬夜

2022-08-08

96.0000 1 0
  • 关注作者
  • 收藏

主流的关系型数据库

• Oracle:运行稳定、可移植性高、功能齐全、性能超群,适用于大型企业 • DB2:速度快、可靠性好、适用于海量数据、恢复性极强,适用于大中型企业• MySQL:开源、体积小、速度快,适用于中小型企业 • SQL server:全面高效、界面友好易操作,但是不跨平台,适用于中小型企业

从今天开始不熬夜

2022-08-06

60.0000 1 0
  • 关注作者
  • 收藏

流量指标分析

1.浏览量PV:页面浏览量或点击量Page View,用户每打开一个网页就记录1次PV,用户多次访问同 一页面PV累计多次。 2.访客数UV:访问页面的独立访客Unique Visitor,用户访问该页面的一台电脑客户端为一个访客, 以浏览器的cookie为依据,同一个用户多次访问只计算一个UV。 3.人均浏览量PV/UV:平均每个独立访客的浏览次数,体现网站对用户的吸引程度。

从今天开始不熬夜

2022-08-06

60.0000 1 0
  • 关注作者
  • 收藏

电商用户行为数据分析目标与思路

探索目标:每日不同时段流量走势,质量如何?用户行为转化情况怎样?如何提高留存、增加复购?如 何判断高价值用户,针对不同用户如何进行个性化营销?分析思路:1.流量指标分析:对比每日每小时的PV(访问量)、UV(访客数)、平均访问量(PV/UV),在不 同时间发布不同的营销活动,寻找更优质的拉新渠道。2. 行为转化分析:统计用户不同行为的转化情况,简化交易流程,提高转化率。3. 产品贡献定量分析:根据

从今天开始不熬夜

2022-08-06

60.0000 1 0
  • 关注作者
  • 收藏

支持SSH协议的软件

常见的支持SSH协议的软件有:FinalShell、Putty、xshell、secureCRT

从今天开始不熬夜

2022-08-05

60.0000 1 0
  • 关注作者
  • 收藏

SSH加密实现远程登录

企业中,Linux服务器通常位于远程机房中,用户不方便直接在机房操作;.可以使用支持SSH协议的软件,通过远程登录操作访问服务器,并且SSH协议可以实现对传输内容的加密.

从今天开始不熬夜

2022-08-05

60.0000 1 0
  • 关注作者
  • 收藏

SSH协议

SSH协议:SSH为Secure Shell的缩写,是一种网络安全协议,专为远程登录会话和其他网络服务提供安全性的协议。 在Linux中,SSH的主要用途有:用户加密实现远程登录、服务器之间的免密登录。 SSH协议默认采用RSA算法实现非对称加密,需要两个密钥:公开密钥(public key:简称公钥)和私有密钥( private key:简称私钥)。 公钥与私钥是一对,如果用公钥对数据进行加密

从今天开始不熬夜

2022-08-05

60.0000 1 0
  • 关注作者
  • 收藏

VMware

在PC上安装VMware Workstation虚拟机软件时,最好将软件安装在一个没有中文、没有空格的目录下.

从今天开始不熬夜

2022-08-05

60.0000 1 0
  • 关注作者
  • 收藏

FinalShell连接Linux

FinalShell连接Linux时,配置windows上的hosts映射文件,hosts文件路径:C:\Windows\System32\drivers\etc\hosts,将192.168.88.151 node1 192.168.88.152 node2 192.168.88.153 node3放入hosts时,一般会提示无管理员权限,无法更改,此时,将hosts文件拖到桌面 在桌面上更改完

从今天开始不熬夜

2022-08-05

60.0000 1 0
  • 关注作者
  • 收藏

数据库

数据库分类:• 关系型数据库:以表的形式存储的结构化数据集 • 非关系型数据库:以键值对形式存储的非结构化数据集

从今天开始不熬夜

2022-08-04

94.9283 1 0
  • 关注作者
  • 收藏

聚合函数作为开窗函数

在窗口中每条记录动态应用聚合函数(sum/avg/max/min/count),可以动态计算在指定的窗口内的各种 聚合函数值。

从今天开始不熬夜

2022-08-04

94.9283 1 0
  • 关注作者
  • 收藏
<13456>