京公网安备 11010802034615号
经营许可证编号:京B2-20210330
阻碍大数据成功的常见问题
缺乏熟练的数据专业人员(例如资源和内部技术能力)是很多企业面临最大的问题,此外,还缺乏高价值的商业案例。如今,为了收集大数据状态的见解,行业媒体与来自20家企业的22位高管进行了交流,他们主要从事大数据工作,或为客户提供大数据解决方案。
当人们问:“你们认为阻止企业获得大数据的好处的最常见的问题是什么?”以下是这些高管给出的答案:相信如果企业建立一个大数据湖,其结果变得明显。数据管理是一个问题。计划预期成果和企业想要实现的见解。思考如何进行更多的高级分析。使用正确的工具作业。确定要在数据仓库中使用的内容。企业不了解业务层面的大数据。他们没有确定他们需要解决的业务问题,了解什么是正常工作,以及可以做些什么来增加价值。
一半的IT项目正在整合应用程序。获取访问权限如何清理和应用数据治理,看到两个整合,以及有能力外包的厂商?虽然平台的访问费用较低,hadoop和Cassandra的进入障碍可能很高。
需要对不同的格式进行归一化,收集,洞察,标记,并采用可搜索的格式。
一个常见的问题是简单地低估了实现一个功能齐全的大数据系统的难度。还有很多其他的工具也会让企业开始,很多开放源码是伟大的沙盒,但对于生产级大数据系统是完全不同的。随着业务需求的变化,保持系统的运行和发展是另一个重大挑战。人们一再听到同样的故事,他们了解大数据解决方案,并说:“感谢这个想法,我们有一些大数据体验,我们认为自己也可以建立。”通常,这些团队在几个月后将会表示,这比我们想像的还要难。
能够动态地连接不同的来源,尽可能地保持工作的进程,使他们能够专注于更高层次的活动。复杂性加剧了整合和实施数据所需的技能。尝试将所有数据集中在一起,以便企业可以更改访问数据的80:20比例,并分析其数据。企业找不到需要查找的数据,因为它有太多的数据。有些文件名是神秘的,害怕给人们访问数据,因为不知道数据是什么。企业需要摄取,编目和查找数据。
惯性。没有开始
由公司的能力而异。对大数据集群的认知是10到50个,只有少数几个客户拥有数千个节点。开始运行并及时了解版本,而工具的标准化成为额外的工作。文化。大公司受益于大数据分析,摆脱项目必须成功的假设,允许失败和学习,允许迭代和实验。像西门子和菲利普斯这样的创新领导者可以向业务团队展示当允许失败时可以获得多大的成功。固定特定技术。确定正在尝试解决什么问题,并准备随着时间推移。拥有合适的人选。人才问题很大。企业必须有合格的候选人。数据科学家必须保持技术前沿,知道哪些工具正在发展以解决问题。
他们需要指导。生态系统正在迅速发展,企业必须处于不利地位,才能知道问题的最佳解决方案。Spark需要从存储密集型到计算密集型的不同架构。对于具有传统系统的传统企业而言更为困难。他们倾向于更加缓慢而有条不紊地采取行动。行业厂商为银行和保健公司创建了一个商业价值顾问团队。有客户设定具体目标(即减少4%的流失)达到或超过目标,然后转到下一个项目。开源的速度对大多数人来说是压倒性的。企业需要知道接下来会发生什么,所以可以相应地进行规划。行业厂商正在推动开放标准,使客户更加灵活,拥有更多技能和便携性的市场。在云计算和本地的大数据方面保证灵活性。
缺乏资源和内部的技术能力。每个人都需要了解人们在自己的网站和博客上做了什么。有几个好产品可以告诉你这些事情,比如MixPanel和Google Analytics(谷歌分析),而不再需要数据科学家的帮助。存在于孤岛的数据:太难以及时并入并提取有意义的见解。存储和忘记大数据的方法:没有明确的分析大数据的策略来实现业务收益。技能缺口:大数据系统/工具太复杂,无法用于大多数员工。收集涉及特定个人行为的数据时,担心法律问题。在B2B中,这是一个真正的关注点。“数据足够好”的问题总是发挥作用。这是一个有效的关注,但是没有做任何事情都没有回答这个问题。。如果你失败了,就会知道你的数据收集应该在哪里改善。企业明白可以应用的用例,但它是一种新型的项目,目前还没有很多系统集成商可以支持它们。
无法界定明确的业务目标。获得具有技能的人实现目标。没有足够的人拥有提供大型数据项目所需的知识和经验。软件工程师不仅要了解概念和可能性,还要了解如何提供。人们经常认为他们需要数据科学家,但他们需要产品所有者,数据工程团队,数据科学家等等。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10