京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SAS如何看待大数据
“大数据”现在是一个炙手可热的词语,数据分析师这个词虽然比较新,但收集与存储大量信息的历史却不短了。
早在本世纪初,行业分析师Doug Laney就提出了“3V模型”来定义大数据,如今已经成为主流。所谓“3V模型”分别是指数据量(Volume)、速率(Velocity)、多样性(Variety)。
数据量(Volume)是指一些组织从商业交易、社会媒体等来源收集数据,从传感器或者机器通信(M2M)数据中获取信息。以前存储这些数据或者信息是一个难题,但新兴的技术(如Hadoop等)减轻了这项负担。
速率(Velocity)是指数据以一种空前的速度流入,而且必须得到及时的处理。无线射频识别 (RFID)标签、传感器以及智能仪表使得对于连续涌来的数据进行“准实时”处理的需求越发突出。
多样性(Variety)获得的数据具有各种各样的格式(从传统数据库中的结构化数值型数据到非结构化的文本文档、邮件、视频、音频、股票行情及经济交易等)。
不过SAS对大数据另有独到看法。SAS是在中国的文化大革命时期建立和发展起来的一家数据处理公司,现在已经是数据行业的领军企业。SAS在3V模型的基础上加入了另外两个维度:可变性(Variability)和复杂性(Complexity)。
可变性(Variability)是指数据流不稳定易变化的特征。除了数据速率提升及多样性增加的问题,数据流还有着极不稳定的周期峰值。是否有什么在社会媒体中起了导向作用?每日的、季度的以及事件触发性的数据负载高峰会给数据管理造成极大的挑战,这在处理非结构化数据时尤为明显。
复杂性(Complexity)是指随着数据来源多样化、数据流可变性增加,数据处理日益复杂化。如今数据的来源各种各样,这会给跨系统的数据关联、匹配、清洗以及转换造成困难。然而,对数据间的关系、层级以及多数据间的联结点进行关联是十分重要的,否则你的数据很快就会失控。
来自VISA的启示
全球已产生的和存储的数据量是无法想象的,而且它还在持续增长。毫无疑问,大数据在商业分析方面有巨大的潜力。那么企业怎样才能更好地应用这些每天新增的原始数据呢?
大数据的重要性不在于你拥有多少数据,而在于CDA数据分析师如何使用这些数据,同时数据分析师还要得到数据分析师认证。你能从任意来源渠道获取数据,并且通过对其进行分析从而减少损耗、缩短用时、发展新产品和优化供应方案、最终使智能决策成为可能。
著名的信用卡服务公司VISA就利用大数据,减少了欺骗性信用卡和借贷卡的办理。和绝大多数信用卡公司一样,Visa在为客户提供看不见的服务的时候面临着诈骗活动的挑战——解决这个问题的难处在于提供服务和避免欺诈并不能总是一同解决。
比如说,当信用卡公司首次运用计算机系统自动分析判断欺诈交易时,有更多的在外度假或公干的客户反映支付被拒,因为这项技术的难点在于计算机很难评估用户是在旅游,还是信用卡被盗刷了。
Visa中为北亚问题提供解决方案的负责人Nathan Falkenborg说:“如果我们得知你很可能在旅游,那么我们就会告诉你参与的金融机构,让你在购物的时候不会被拒绝支付,我们也会协助银行制定更优的Visa工具和积分系统的使用策略。”
而利用大数据分析,Visa可以实时地分析超过500项独立的变量,来判断用户到底是在异地度假或公干使用信用卡、还是用户的信用卡在异地被盗刷了。这对于减少欺骗性交易、又不让用户被不必要的支付遭拒所困扰有很大的帮助,而且潜在地节省了每年二十亿美元的欺骗性支付额。
各行业如何利用大数据
大数据对几乎每个行业的组织都产生了影响,让我们来看看每个产业怎样才能从信息的大量涌入中获益呢。
银行
随着大量的信息流,银行正在寻找新的并且创新的方法来管理大数据。虽然去理解顾客和让他们更满意是很重要的,但是在遵从法规的同时减少风险和欺诈也是同样的重要。大数据带来了伟大的见解,但是它也要求金融机构要利用先进的分析策略和技术,在这场大数据游戏中领先一步。
教育
有着数据驱动思维的教育者将对教育系统,学生和课程产生重要的影响。通过分析大数据,他们可以识别有潜在困难的学生,从而确保学生在学业上有适当的进展,还可以形成一个更好的系统,以评估和支持教师和校长。
政府
当政府机关有能力去利用分析学分析大数据,在管理公用工程,机构的运行,处理交通拥堵或者以防犯罪的问题上他们可以得到非常有意义的资料。但是大数据虽然有非常多的好处,政府必须解决隐私和透明度的问题。
卫生保健
病人的记录,治疗计划,处方信息。当谈到卫生保健,每一件事都需要快速准确的完成,在有一些情况下,我们还需要有足够的透明度去达到该产业的严格规章。如果大数据被高效的运用,卫生保健服务供应者可以揭示一些不易察觉的见解以提升患者护理质量。
制造业
有着大数据可以提高的见解,制造业可以在减少浪费的同时提高质量和产量——这是一个在当今高度竞争市场上的重要一个关键过程。越来越多的制造商正在处于一个可以更快的解决的问题和快速做出商业决策。
零售
在零售业建立客户关系是重要的一部分——而最好办法就是管理大数据。零售商需要知道向客户推销的最好方式,处理交易的最有效方式以及让疲软的经济再次繁荣的最富有策略的方式,而大数据是所有的这些的核心。数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22