带着镣铐跳舞大数据商业智能需要守清规-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读带着镣铐跳舞大数据商业智能需要守清规

带着镣铐跳舞大数据商业智能需要守清规

2017-07-17

带着镣铐跳舞大数据商业智能需要守清规

时下，不少企业更新了上一代架构来存储大数据。可以得知的是，当大数据存储架构更换之时，上一代商业智能(BI)工具，势必得更新。而当企业选择BI工具时，需要遵守哪些“清规戒律”？

没有规矩不成方圆，同样如果BI选择不当，或者在使用上有处置不当的地方，势必造成不可挽回的损失，甚至早成公司数字资产的丢失，那就得不偿失了。那么，在选择BI工具时，我们应该如何选择，需要注意哪些事项呢？

一、切忌转移大数据

大数据的提取和转移的代价是高昂的，首先数据量大，将其打包转移，负担太重。其次，将数据提取出来，做成数据集市和数据立方，会在维护、网络性能附加处理器方面造成纷乱庞杂的问题。总之，在选择BI工具时，切忌对大数据进行转移。

二、不要违反企业安全政策

每行每业都在谈安全，人身、财产、网络，大数据诞生便跟随着许多安全事件，比如物理删除等，所以数据泄露事件，也并非不发生。在选择BI工具时，企业首先考虑能够利用现有安全模型的BI工具，依靠Ranger、Sentry、Knox等综合性安全系统，大数据可以使数据安全变得更加容易。

三、谨防价格陷阱

相比传统存储，大数据的优势在于性价比比较高，然而最初使用时，它的价格并不低。所以，在选购的时候尽可能谨防价格陷阱，不要贪图一时的便宜，采用按照数据量或者索引数据量。在此处，大数据系统的好处在于渐进式可扩展性，当长期使用，它的访问量会得到指数式增长，所以不要贪图一时的便宜，从而放弃对对企业增长征收“高税”的BI工具。

四、借鉴可视图

最早的数据分析往往采用静态图，比如统计出来做成的PDF、PNG，所谓的静态图标。但是，对于大数据和商业智能来讲，静态图标远远不够，真正的数据交互才是数据分析的正途，做出来的图是交互式路线图，不断变化的动图。

五、分析天然形态的数据

在大数据领域，有许多数据格式，比如JSON。JSON可以使半结构化、多结构化等等，Mongo对JSON数据格式下了重注，具有好处理和可规模化的优点，如果把它转换成表格，表达力就会丢失。很多大数据仍然被制成表格，通常拥有数千栏。你不得不为所有的值寻找关系：“在那种情况下……从这里选择这个”。扁平化会毁掉原始结构中所表达的重要关系。远离那些对你说“请把数据转换成表格，因为我们一直都这么干”的BI解决方案。

六、不要长时间等待结果

联机分析处理(OLAP)立方，本质上就是把数据转移到预计算缓存，从而加快处理速度，这样数据处理就变得快了起来。但是运用这种方式，用户必须提取和转移数据，以便建造数据立方，然后才能加快速度。现在，这种方法能够在一定的数据规模下良好运转，但如果临时表格过于庞大，你的笔记本电脑在试图将表格本地化的时候就会崩溃。当你提取新数据重建缓存时，新数据的分析就会中途停下来。此外还要注意样本问题，你可能会得到一个看起来不错、效果很好的可视图，但最后却发现全不对路，而问题就出在缺少大局观。要选择那些能便捷地不断调整数据的BI工具。

七、打造应用

在大数据时代，BI用户希望从多个来源获得异步数据，这样他们就不需要刷新任何东西，就好像浏览器和移动设备上运行的其他各种东西。用户希望和可视元素进行交互，得到他们正在寻找的答案，而不是对你已经提供给他们的结果进行交叉过滤。Rails等框架使打造Web应用变得更加简单，我们需要通过现代Web应用开发的透镜来看待BI。

八、利用智能工具

在庞大的数据规模下，自动维护几乎是不可或缺的，我们可以从用户和数据与可视图的交互中获得大量信息，现代工具应该使用这些信息来对数据网络效应加以利用。另外，要选择那些内置全面搜索能力的工具，因为我曾见过有些客户拥有成千上万的可视图。你需要一种迅速查找的方法，在网络的长年熏陶之下，我们已经习惯了搜索，而不是翻找菜单。

九、要超越基本范畴

如今的大数据系统因为预测分析能力而著称。相关性、预测和其他功能使企业用户比以往任何时候都能更便捷地进行高级分析。不需要编程经验就能处理大数据的可视化技术让分析师如有神助，超越了基本分析的范畴。为了实现其真正的潜力，大数据不应该依赖于每个人都变成R预言程序员。

十、善于利用Hadoop

不管你是把大数据当成数据湖还是企业数据中心，Hadoop已经改变了数据的处理速度和存储成本，我们每天都在创造更多的数据。但在真正利用大数据为企业用户服务方面，常常存在一种“只写系统”——创造数据的人很多，但利用数据的人却很少。

其实，用Hadoop里的数据可以为企业用户解答数不清的问题。BI讲究的是打造数据可视化应用，为日常决策提供支持。所以，在实际应用过程中，企业要善于利用Hadoop。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据 Hadoop 商业智能数据格式数据分析数据安全 OLAP 数据湖

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

带着镣铐跳舞大数据商业智能需要守清规

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

带着镣铐跳舞 大数据商业智能需要守清规

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

带着镣铐跳舞大数据商业智能需要守清规