京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SAS如何看待大数据
“大数据”现在是一个炙手可热的词语,数据分析师这个词虽然比较新,但收集与存储大量信息的历史却不短了。
早在本世纪初,行业分析师Doug Laney就提出了“3V模型”来定义大数据,如今已经成为主流。所谓“3V模型”分别是指数据量(Volume)、速率(Velocity)、多样性(Variety)。
数据量(Volume)是指一些组织从商业交易、社会媒体等来源收集数据,从传感器或者机器通信(M2M)数据中获取信息。以前存储这些数据或者信息是一个难题,但新兴的技术(如Hadoop等)减轻了这项负担。
速率(Velocity)是指数据以一种空前的速度流入,而且必须得到及时的处理。无线射频识别 (RFID)标签、传感器以及智能仪表使得对于连续涌来的数据进行“准实时”处理的需求越发突出。
多样性(Variety)获得的数据具有各种各样的格式(从传统数据库中的结构化数值型数据到非结构化的文本文档、邮件、视频、音频、股票行情及经济交易等)。
不过SAS对大数据另有独到看法。SAS是在中国的文化大革命时期建立和发展起来的一家数据处理公司,现在已经是数据行业的领军企业。SAS在3V模型的基础上加入了另外两个维度:可变性(Variability)和复杂性(Complexity)。
可变性(Variability)是指数据流不稳定易变化的特征。除了数据速率提升及多样性增加的问题,数据流还有着极不稳定的周期峰值。是否有什么在社会媒体中起了导向作用?每日的、季度的以及事件触发性的数据负载高峰会给数据管理造成极大的挑战,这在处理非结构化数据时尤为明显。
复杂性(Complexity)是指随着数据来源多样化、数据流可变性增加,数据处理日益复杂化。如今数据的来源各种各样,这会给跨系统的数据关联、匹配、清洗以及转换造成困难。然而,对数据间的关系、层级以及多数据间的联结点进行关联是十分重要的,否则你的数据很快就会失控。
来自VISA的启示
全球已产生的和存储的数据量是无法想象的,而且它还在持续增长。毫无疑问,大数据在商业分析方面有巨大的潜力。那么企业怎样才能更好地应用这些每天新增的原始数据呢?
大数据的重要性不在于你拥有多少数据,而在于CDA数据分析师如何使用这些数据,同时数据分析师还要得到数据分析师认证。你能从任意来源渠道获取数据,并且通过对其进行分析从而减少损耗、缩短用时、发展新产品和优化供应方案、最终使智能决策成为可能。
著名的信用卡服务公司VISA就利用大数据,减少了欺骗性信用卡和借贷卡的办理。和绝大多数信用卡公司一样,Visa在为客户提供看不见的服务的时候面临着诈骗活动的挑战——解决这个问题的难处在于提供服务和避免欺诈并不能总是一同解决。
比如说,当信用卡公司首次运用计算机系统自动分析判断欺诈交易时,有更多的在外度假或公干的客户反映支付被拒,因为这项技术的难点在于计算机很难评估用户是在旅游,还是信用卡被盗刷了。
Visa中为北亚问题提供解决方案的负责人Nathan Falkenborg说:“如果我们得知你很可能在旅游,那么我们就会告诉你参与的金融机构,让你在购物的时候不会被拒绝支付,我们也会协助银行制定更优的Visa工具和积分系统的使用策略。”
而利用大数据分析,Visa可以实时地分析超过500项独立的变量,来判断用户到底是在异地度假或公干使用信用卡、还是用户的信用卡在异地被盗刷了。这对于减少欺骗性交易、又不让用户被不必要的支付遭拒所困扰有很大的帮助,而且潜在地节省了每年二十亿美元的欺骗性支付额。
各行业如何利用大数据
大数据对几乎每个行业的组织都产生了影响,让我们来看看每个产业怎样才能从信息的大量涌入中获益呢。
银行
随着大量的信息流,银行正在寻找新的并且创新的方法来管理大数据。虽然去理解顾客和让他们更满意是很重要的,但是在遵从法规的同时减少风险和欺诈也是同样的重要。大数据带来了伟大的见解,但是它也要求金融机构要利用先进的分析策略和技术,在这场大数据游戏中领先一步。
教育
有着数据驱动思维的教育者将对教育系统,学生和课程产生重要的影响。通过分析大数据,他们可以识别有潜在困难的学生,从而确保学生在学业上有适当的进展,还可以形成一个更好的系统,以评估和支持教师和校长。
政府
当政府机关有能力去利用分析学分析大数据,在管理公用工程,机构的运行,处理交通拥堵或者以防犯罪的问题上他们可以得到非常有意义的资料。但是大数据虽然有非常多的好处,政府必须解决隐私和透明度的问题。
卫生保健
病人的记录,治疗计划,处方信息。当谈到卫生保健,每一件事都需要快速准确的完成,在有一些情况下,我们还需要有足够的透明度去达到该产业的严格规章。如果大数据被高效的运用,卫生保健服务供应者可以揭示一些不易察觉的见解以提升患者护理质量。
制造业
有着大数据可以提高的见解,制造业可以在减少浪费的同时提高质量和产量——这是一个在当今高度竞争市场上的重要一个关键过程。越来越多的制造商正在处于一个可以更快的解决的问题和快速做出商业决策。
零售
在零售业建立客户关系是重要的一部分——而最好办法就是管理大数据。零售商需要知道向客户推销的最好方式,处理交易的最有效方式以及让疲软的经济再次繁荣的最富有策略的方式,而大数据是所有的这些的核心。数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11