京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CIO如何轻松玩转移动和云端的大数据
移动,云计算和大数据都被赋予了很多期待,人们希望这些技术能帮助企业提高工作和生产效率,提高决策能力和降低成本。其中最大的希望就是使企业 变得更有竞争力,但是对于企业的IT部门,合规团队来说,这些新技术常常会增加复杂性,由于大量的数据正在移动到不断增长的终端,其中包括各种移动设备和 第三方托管服务,因此失去了对成本的控制,甚至还增加了成本。不过,办法总比困难多,可以用规范信息元数据的新方法来克服这些挑战。
如果IT系统不能完全清楚存在什么数据以及各种不同类型的信息所在的位置,那么它就不能确保合适的人在合适的时间的合适的访问权限,也肯定不能 充分地免遭破坏和盗窃,或者不能按照新隐私法律的要求删除隐私信息。随着需要收集的数据的数量的增长,电子披露成本也随之猛增。甚至企业用户会遭受他们日 常活动所需的信息和大数据分析所需要的数据变得更难找到和管理的情况,从而降低工作效率,事倍功半,同时消弱提高决策能力的期望。
要持久地掌控迅速发展的数据存储,企业需要有长远而深刻的洞见和规划,适用于所有的数据,无论由谁创造,无论存于哪里,无论由谁分享。不幸的 是,大部分企业觉得这需要大笔的花费,将其视为一项艰巨的挑战。然而,事实上有一个非常简单和具有成效的方法可以实现,那就是你愿意持续地去做,这样会比 什么都不做要好得多。
该策略是基于将典型的使用在结构化数据库的相同的元数据标准化应用到企业内部部署和云端的所有其他数据上面,包括所有信息类型(电子邮件,文本 文件和SMS,社交媒体等),文档(文字处理,电子表格,演示文稿等),甚至还包括日志文件。在某些受管制的行业,如金融服务,元数据标准化还可以应用到 语音通信数据,如通话录音和语音邮件文件。
比如说,你有一个主要的“工人”ID数据库(例如,员工,在飞机上的外部职员)。使用这个ID来标记每个文档,信息和数据库,并记录由谁创建, 由谁更改,由谁删除,这使得在各个平台的一系列业务进程以和需求相符的数据传回特定人员成为可能,不管数据是否是经过云存储的方式或者在移动设备之间几经 周折。仅这一步也能有助于使得电子披露更有效率,使数据保护和隐私保护变得容易。然后它将还可能确定每个个体其所有数据源(应用程序,共享服务,本地,云 端等)完整的“数据足迹”。
标准化元数据不仅使查找和检索数据更容易一些,还给大数据分析项目带来重要价值。例如,如果你也开始持续标记数据,其中数据即包括客户数据,也 包括产品数据,而且这些数据还分别拥有客户ID和产品ID,你自然会加入分析价值,不管是否和判定公司产品(尽管公司可能还没有产品)的市场需求,为能够 在创收产品中做出贡献的员工提高支持力度,确定客户沟通和客户投资之间的关系,以及很多其他现在实现起来可能有困难或者根本不可能实现的机会这些相关。使 数据丰富起来,降低或消除数据的单一化,调节,映射以及其他和时间资源非常相关的精细的手动工作将会有积极的影响。
让我们来看看另外一个重要的使用案例。对于CIO来说,越过防火墙迁移数据加剧了已有的挑战,这一挑战就是从企业中大约75%的杂乱的碎片信息 中区分出有价值的信息。如果你想实现无论数据在哪里,你都能管理好数据,如果你想摆脱数据中心,将数据有效率地迁移到云端,那么确定当前数据中心中有什么 数据,哪些是重要的,哪些是没有任何价值的,这些至关重要。将标准化元数据应用到企业的所有数据中能够显著地提高鉴定重要信息的能力,连同业务,法律,记 录,合规性和安全价值,所有这些开始让企业的暗数据重焕光彩。
不是革命,而是演进
你使用的标签能显著地改善数据管理,支持电子披露,法规遵从,数据碎片处理,网络安全和威胁响应这些方面,使之变得不再不可逾越。如上所述,使 用员工ID,客户ID和产品ID可能是一个很好的起点。关键是创建足够的有用标签,但是标签也不能太多,那样会适得其反,标签创建完后,将其应用到公司所 能影响或控制的存在于所有地方的所有类型的数据。
另外,你很可能希望随着时间的推移,不断发展变化的系统和用户行为应用标准化,而不破坏或改变它。实现这一想法的一个策略是随着IT自然生命周 期发展。每次你改变应用程序,平台或服务器的时候,你需要嵌入标准化元数据。最终,使用标准化元数据可能会变成习惯,系统化和普遍性。然后,一旦产生价值 而且你已经证明了其投资回报率,你就可以接着改变传统的系统了。
通过规范方法的元数据标准化,你可以让你的企业更有效地利用新兴的移动,云计算和大数据的机会。有了更全面的知识和对信息的把握,你将会为企业的所有业务流程,包括创收,可持续发展,控制风险,法规遵从,网络安全和电子披露等方面带来巨大的机遇。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25