CDA持证人阿涛哥

安装虚拟机遇到"此主机支持Intel VT-x,但Intrel VT-x处于禁用状态"

安装虚拟机遇到"此主机支持Intel VT-x,但Intrel VT-x处于禁用状态"解决方法1.本机重启进入BIOS2.选择上方菜单[advanced](根据下发提示,↑↓←→移动鼠标)3.进入advanced界面,选择列表中的【CPU Configuration】或者CPU-Setup4.找到【Intel Virtualization Technology】选项,点击回车5.该选项默认的是Di

109.6624 3 0
  • 关注作者
  • 收藏
whq2018

学习笔记——企业数据分析能力简介

企业数据分析能力简介.pdf

122.0617 3 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

HBase存储

HBase是一个高性能、列存储、可伸缩、实时读写的分布式存储系统,同样运行在HDFS之上。与Hive不同的是,HBase能够在数据库上实时运行,而不是跑MapReduce任务,适合进行大数据的实时查询。 画像系统中每天在Hive里跑出的结果集数据可同步到HBase数据库,用于线上实时应用的场景。 下面介绍几个基本概念:·row key:用来表示唯一一行记录的主键,HBase的数据是按照 row k

38.4598 4 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

​关于用户画像3种类型的标签的区别。

1.统计类标签 这类标签是最为基础也最为常见的标签类型,例如,对于某个用 户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天 数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费数据 中统计得出。该类标签构成了用户画像的基础。2.规则类标签 该类标签基于用户行为及确定的规则产生。例如,对平台上“消费活跃”用户这一口径的定义为“近30天交易次数≥2”。在实际开发画像 的过程中,由于

145.4921 6 0
  • 关注作者
  • 收藏
CDA113860

国家统计局工业司高级统计师朱虹解读工业企业利润数据

工业企业利润保持稳定增长 ——国家统计局工业司高级统计师朱虹解读工业企业利润数据   2021年8月份,工业生产稳中有进,企业经营状况继续改善,利润保持稳定增长态势。8月份,全国规模以上工业企业利润同比增长10.1%,比2019年同期增长31.1%,两年平均增长14.5%(以2019年同期数为基数,采用几何平均方法计算)。从1—8月份累计看,规模以上工业企业利润同比增长49.5%,比2019年同期

0.4432 2 0
  • 关注作者
  • 收藏
永洪科技

百万量级数据不要怕,一招教你精准锁定

在做数据分析时你有没有遇到这些问题:数据量大,怎么也找不到特定日期的文件老板要看某年某月的销售数据,你要从百万量级数据中一条条寻找……要是使用永洪BI,会不会有一种方法,让我们在百万量级的数据中,一眼锁定要找的那一条?有的,那便是文件过滤。首先,我们来说一下什么是meta,什么是文件过滤。01 什么是metameta是集市文件上打的标签,可以大致理解为这个集市文件的属性。比如,某个集市数据,我们是

96.4551 3 0
  • 关注作者
  • 收藏
永洪科技

学完这个专题,0基础小白快速上手数据分析

无论是公司还是个人,每天的行为都会产生数据,而如何利用起来这些数据,让这些数据发挥出本来的价值,是门学问。从今天开始,我们将从什么是数据分析讲起,一步一步带大家玩转大数据,变身数据分析高手。01 什么是数据分析数据分析是指用适当的统计分析方法,对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。为什么要去做数据分析?从公司角度来讲,经过多年的信息化建设,每个公司

96.4551 3 0
  • 关注作者
  • 收藏
永洪科技

大数据时代,企业如何拿下竞争话语权?这个方案值得一看

随着孟晚舟案听证会的结束,牵动亿万同胞心的案件,终于将在10月份迎来最终裁决。孟晚舟被扣押在加拿大3年,美国无理由打压了中国高科技企业,已将超过100个中国企业和机构,列入出口管制的“实体清单”。在美国的“制裁”之下,华为的一举一动,给全球供应链也带来影响。由此我们可以看出供应链的重要性,那么:什么是供应链?供应链面临哪些挑战?企业如何解决面临的挑战?供应链管理建设目标和方法是什么?今天,一文带大

96.4551 3 0
  • 关注作者
  • 收藏
永洪科技

高校数字化建设到底该如何推进?这篇方案值得一看

高校信息化的发展已历经三十年。从信息化建设阶段来看,可以分为四个阶段:第一阶段以设备和网络为建设核心,譬如“电教中心”、“计算机中心”;第二阶段以数字化校园建设为核心,譬如 “智慧教室”,“在线教学平台”;第三阶段以数据为核心,譬如有些学校已经把“网络信息中心”更名为“大数据中心”;第四阶段为已建立智慧大脑、人工智能的问题解决平台的发展阶段,譬如自动解答海量疑问、智能办理校内业务、建立人工智能问题

96.4551 3 0
  • 关注作者
  • 收藏
天浪觅

创建表错误--不知哪里有问题

创建表错误--不知哪里有问题

34.7209 2 1
  • 关注作者
  • 收藏
数字人bot

从excel到数据分析大赛获奖,一名产品经理的经验心得

大家好,我是来自一家工业互联网平台的数据产品经理,工作内容大量用到数据报表和PPT。前不久,我参加了2020永洪BI数据分析冬季精英挑战赛,还获得了优胜奖。今天,想跟大家分享一些我的使用体验。在日常的工作中,我接到报表需求都是先用excel对接数据库完成取数,或者直接让开发同事开发到系统中,但问题也丛出不穷,经常遇到开发同事刚完成,业务需求就改变,导致逻辑不断修改,开发投入不断增加。这是我的获奖作

96.4352 2 0
  • 关注作者
  • 收藏
syn616

CDA

EDIT中E,D,I,T分别是什么意思

597.5080 3 1
  • 关注作者
  • 收藏
tianq2

什么情况

什么情况啊

0.0000 0 0
  • 关注作者
  • 收藏
138****8593

深圳源中瑞区块链产品溯源的作用

区块链系统开发可咨询张小姐13826558593 “区块链技术”其实就是一种新型的云服务,一种结合区块链技术的云服务。可zi询威;ruiectian,在这边就很多人有疑问了,那区块链技术跟产品又有什么关系呀?在这边作者就要跟大家详说一些关于区块链溯源的知识啦。 区块链溯源主要是运用互联网将所有的数据进行整合并分析,精确记录产品的每一个流程与节点,但这些数据也要通过整合后发送到相关的认

18.8496 1 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

k-fold 交叉验证

k-fold 交叉验证:首先将全部样本划分成 k 个大小相等的样本子集;依次遍历这 k 个子集,每次把当前子集作为验证集,真余所有子集作为训练集,进行模型的训练和评估;最后把 k 次评估指标的平均值作为最终的评估指标 。 在实际实验中, k 经常取 10。

18.8654 2 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

如何进行线上A/B 测试?

进行 A/B 测试的主要手段是进行用户分桶,即将用户分成实验组和对照组,对实验组的用户施以新模型 ,对对照组的用户施以旧模型 。在分桶的过程中 ,要注意样本的独立性和采样方式的无偏性,确保同一个用户每次只能分到同一个桶中,在分桶过程中所选取的 user_id 需要是一个随机数,这样才能保证桶中的样本是无偏的 。

18.8654 2 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

余弦距离是否是一个严格定义的距离?

首先看距离的定义:在一个集合中,如果每一对元素均可唯一确定一个实数,使得三条距离公理(正定性,对称性, 三角不等式)成立,则该实数可称为这对元素之间的距离。余弦距离满足正定性和对称性,但是不满足三角不等式 ,因此它并不是严格定义的距离 。

18.8654 2 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

余弦距离

在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时, 常使用余弦相似度来表示 。余弦相似度的取值范围是[-1,1 ], 相同的两个向量之间的相似度为 1 。 如果希望得到类似于距菌的表示,将 1减去余弦相似度即为余弦距离 。因此,余弦距离的取值范围为[ 0,2],相同的两个向量余弦距离为 0 。

66.5145 3 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

ROC 曲线的由来

ROC 曲线的由来ROC 曲线最早是运用在军 事上的,后来逐渐运用到医学领域,并于 20 世纪 80 年代后期被引入机器学习领域。相传在第二次世界大战期间,雷达兵的任务之一就是死死地盯住雷达显示器 ,观察是否有敌机来袭。理论上讲,只要有敌机来袭,雷达屏幕上就会出现相应的信号。但是实际上 ,如 果飞鸟出现在雷达扫描区域时 , 雷达屏幕上有时也会出现信号。这种情况令雷达兵烦恼不己,如果过于谨慎,凡是有

78.4503 3 0
  • 关注作者
  • 收藏
CDA持证人阿涛哥

AUC值

AUC指的是 ROC 曲线下的面积大小 , 该值能够量化地反映基于 ROC 由线衡量出的模型性能 。 计算 AUC 值只需要沿着ROC 横轴做积分就可以了 。 由于 ROC 曲线一般都处于 y=x 这条直线的上万(如果不是的话,只要把模型预测的概率反转成 1-p 就可以得到一个更好的分类器),所以 AUC 的取值一般在 0.5 ~1之间 。 AUC越大 , 说明分类器越可能把真正的正样本排在前面

18.8654 2 0
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励

暂无数据