京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据社会的具体场景大数据的十三大应用场景(1)_数据分析师培训
其实,大数据不是突然出现的,在过去的几十年间,数学分析就已经涉猎金融行业了,诺贝尔经济学奖获得者哈里。马克维茨、威廉。夏普、罗伯特。恩格尔就是利用计量经济学知识和金融市场数据来建立数学模型,预测金融市场产品收益同风险波动的关系。
大数据时代的出现简单的讲是海量数据同完美计算能力结合的结果,确切的说是移动互联网+、物联网产生了海量的数据,大数据计算技术完美地解决了海量数据的收集、存储、计算、分析的问题。
当我们最初谈大数据的时候,谈的最多的可能是用户行为分析,即通过各种用户行为,包括浏览记录,消费记录,交往和购物娱乐,行动轨迹等各种用户行为产生的数据。由于这些数据本身符合海量,异构的特征,同时通过分析这些数据之间的关联性容易匹配某些结果现象。即有一堆的行为因子x,同时又有一堆的结果构成y,我们找寻到了某种相关性,有利于我们调整后续的各种策略。
为何Google能够做大数据?你思考过吗?因为搜索本身往往是用户行为的一个重要入口,即搜索引擎具备了实时采集多个用户行为的x因子的能力。而这个能力往往是单个电商门户网站无法做到的。但是搜索引擎做大数据的弱势在哪里?即前面谈到的用户和用户之间的关系较难建立,而更多是本身行为之间的相关性。从这个差异上也可以看到搜索引擎更加容易做交通,疾病,气象等方面的大数据分析和预测;而类似电商平台或类似腾讯更加容易做消费和娱乐类的大数据分析和预测。
对于大数据的应用场景,包括各行各业对大数据处理和分析的应用,最核心的还是用户需求。接下来,本文通过梳理各个行业在大数据应用领域面临的挑战、如何寻找突破口来展示其潜在存在的大数据应用场景。
一、医疗大数据看病更高效
除了较早前就开始利用大数据的互联网公司,医疗行业是让大数据分析最先发扬光大的传统行业之一。医疗行业拥有大量的病例,病理报告,治愈方案,药物报告等等。如果这些数据可以被整理和应用将会极大地帮助医生和病人。我们面对的数目及种类众多的病菌、病毒,以及肿瘤细胞,其都处于不断的进化的过程中。在发现诊断疾病时,疾病的确诊和治疗方案的确定是最困难的。
在未来,借助于大数据平台我们可以收集不同病例和治疗方案,以及病人的基本特征,可以建立针对疾病特点的数据库。如果未来基因技术发展成熟,可以根据病人的基因序列特点进行分类,建立医疗行业的病人分类数据库。在医生诊断病人时可以参考病人的疾病特征、化验报告和检测报告,参考疾病数据库来快速帮助病人确诊,明确定位疾病。在制定治疗方案时,医生可以依据病人的基因特点,调取相似基因、年龄、人种、身体情况相同的有效治疗方案,制定出适合病人的治疗方案,帮助更多人及时进行治疗。同时这些数据也有利于医药行业开发出更加有效的药物和医疗器械。
医疗行业的数据应用一直在进行,但是数据没有打通,都是孤岛数据,没有办法进行大规模应用。未来需要将这些数据统一收集起来,纳入统一的大数据平台,为人类健康造福。政府和医疗行业是推动这一趋势的重要动力。
二、生物大数据改良基因
自人类基因组计划完成以来,以美国为代表,世界主要发达国家纷纷启动了生命科学基础研究计划,如国际千人基因组计划、DNA百科全书计划、英国十万人基因组计划等。这些计划引领生物数据呈爆炸式增长,目前每年全球产生的生物数据总量已达EB级,生命科学领域正在爆发一次数据革命,生命科学某种程度上已经成为大数据科学。
我们来看看今天的准妈妈们,除了要准备尿布、奶瓶和婴儿装,她们还会把基因测试列入计划单。基因测试能让未来的父母对于他们未出生的baby的健康有更多的了解。对基因携带者筛查和胚胎植入前诊断,使一个家庭孕育小孩的过程产生了巨大改变。
当下,我们所说的生物大数据技术主要是指大数据技术在基因分析上的应用,通过大数据平台人类可以将自身和生物体基因分析的结果进行记录和存储,利用建立基于大数据技术的基因数据库。大数据技术将会加速基因技术的研究,快速帮助科学家进行模型的建立和基因组合模拟计算。基因技术是人类未来战胜疾病的重要武器,借助于大数据技术的应用,人们将会加快自身基因和其它他生物的基因的研究进程。未来利用生物基因技术来改良农作物,利用基因技术来培养人类器官,利用基因技术来消灭害虫都即将实现。
与全球蒸蒸日上的生物大数据创新发展热潮相比,中国的研发及应用才拉开帷幕。我国有四大方面非常欠缺:其一,国内现有的生物大数据分析能力虽然与欧美相差不大,但是在数据分析构架、软件系统与先进的IT技术接轨上有待提升。其二,国外在生物大数据领域的领先人才多,尽管我们也有国际顶级刊物上发表的论文和成果,总体而言,国内高水准团队还是少。其三,欧美讲求成果应用,层出不穷的分析软件可被实验室、临床、产业多方应用。其四,在生物大数据理论研究、标准制定和广泛应用上,中国都亟待全面跟进。
三、金融大数据理财利器
金融行业的大数据面临的往往是同样的问题,但是情况可能要好点,类似企业和个人的一些信用记录现在有全国性质的统一数据库能够拿到部分数据。但是对于单个银行来说,同样是无法拿到用户在其他银行的行为记录数据的,其二银行本身在做很多信贷风险分析的时候,确实需要大量数据做相关性分析,但是很多数据来源于政府各个职能部门,包括工商税务,质量监督,检察院法院等,这些数据短期仍然是无法拿到。还有就是企业或个人本事日常产生的各种行为数据更难拿到,那么对客户的风险性评估还是得借用原来的老方法而已。
大数据在金融行业应用范围较广,典型的案例有花旗银行利用IBM沃森电脑为财富管理客户推荐产品;美国银行利用客户点击数据集为客户提供特色服务,如有竞争的信用额度;招商银行利用客户刷卡、存取款、电子银行转帐、微信评论等行为数据进行分析,每周给客户发送针对性广告信息,里面有顾客可能感兴趣的产品和优惠信息。
可见,大数据在金融行业的应用可以总结为以下五个方面:
精准营销:依据客户消费习惯、地理位置、消费时间进行推荐
风险管控:依据客户消费和现金流提供信用评级或融资支持,利用客户社交行为记录实施信用卡反欺诈
决策支持:利用抉策树技术进抵押贷款管理,利用数据分析报告实施产业信贷风险控制
效率提升:利用金融行业全局数据了解业务运营薄弱点,利用大数据技术加快内部数据处理速度
产品设计:利用大数据计算技术为财富客户推荐产品,利用客户行为数据设计满足客户需求的金融产品
四、零售大数据最懂消费者
零售行业大数据应用有两个层面,一个层面是零售行业可以了解客户消费喜好和趋势,进行商品的精准营销,降低营销成本。另一层面是依据客户购买产品,为客户提供可能购买的其它产品,扩大销售额,也属于精准营销范畴。另外零售行业可以通过大数据掌握未来消费趋势,有利于热销商品的进货管理和过季商品的处理。零售行业的数据对于产品生产厂家是非常宝贵的,零售商的数据信息将会有助于资源的有效利用,降低产能过剩,厂商依据零售商的信息按实际需求进行生产,减少不必要的生产浪费。
未来考验零售企业的不再只是零供关系的好坏,而是要看挖掘消费者需求,以及高效整合供应链满足其需求的能力,因此信息科技技术水平的高低成为获得竞争优势的关键要素。不论是国际零售巨头,还是本土零售品牌,要想顶住日渐微薄的利润率带来的压力,在这片红海中立于不败之地,就必须思考如何拥抱新科技,并为顾客们带来更好的消费体验。
想象一下这样的场景,当顾客在地铁候车时,墙上有某一零售商的巨幅数字屏幕广告,可以自由浏览产品信息,对感兴趣的或需要购买的商品用手机扫描下单,约定在晚些时候送到家中。而在顾客浏览商品并最终选购商品后,商家已经了解顾客的喜好及个人详细信息,按要求配货并送达顾客家中。未来,甚至顾客都不需要有任何购买动作,利用之前购买行为产生的大数据,当你的沐浴露剩下最后一滴时,你中意的沐浴露就已送到你的手上,而虽然顾客和商家从未谋面,但已如朋友般熟识。
五、电商大数据精准营销法宝
电商是最早利用大数据进行精准营销的行业,除了精准营销,电商可以依据客户消费习惯来提前为客户备货,并利用便利店作为货物中转点,在客户下单15分钟内将货物送上门,提高客户体验。马云的菜鸟网络宣称的24小时完成在中国境内的送货,以及京的刘强东宣传未来京东将在15分钟完成送货上门都是基于客户消费习惯的大数据分析和预测。
电商可以利用其交易数据和现金流数据,为其生态圈内的商户提供基于现金流的小额贷款,电商业也可以将此数据提供给银行,同银行合作为中小企业提供信贷支持。由于电商的数据较为集中,数据量足够大,数据种类较多,因此未来电商数据应用将会有更多的想象空间,包括预测流行趋势,消费趋势、地域消费特点、客户消费习惯、各种消费行为的相关度、消费热点、影响消费的重要因素等。依托大数据分析,电商的消费报告将有利于品牌公司产品设计,生产企业的库存管理和计划生产,物流企业的资源配制,生产资料提供方产能安排等等,有利于精细化社会化大生产,有利于精细化社会的出现。
六、农牧大数据量化生产
大数据在农业应用主要是指依据未来商业需求的预测来进行农牧产品生产,降低菜贱伤农的概率。同时大数据的分析将会更见精确预测未来的天气气候,帮助农牧民做好自然灾害的预防工作。大数据同时也会帮助农民依据消费者消费习惯决定来增加哪些品种的种植,减少哪些品种农作物的生产,提高单位种植面积的产值,同时有助于快速销售农产品,完成资金回流。牧民可以通过大数据分析来安排放牧范围,有效利用牧场。渔民可以利用大数据安排休渔期、定位捕鱼范围等。
由于农产品不容易保存,因此合理种植和养殖农产品对十分重要。如果没有规划好,容易产生菜贱伤农的悲剧。过去出现的猪肉过剩、卷心菜过剩、香蕉过剩的原因就是农牧业没有规划好。借助于大数据提供的消费趋势报告和消费习惯报告,政府将为农牧业生产提供合理引导,建议依据需求进行生产,避免产能过剩,造成不必要的资源和社会财富浪费。农业关乎到国计民生,科学的规划将有助于社会整体效率提升。大数据技术可以帮助政府实现农业的精细化管理,实现科学决策。在数据驱动下,结合无人机技术,农民可以采集农产品生长信息,病虫害信息。相对于过去雇佣飞机成本将大大降低,同时精度也将大大提高。
七、交通大数据畅通出行
交通作为人类行为的重要组成和重要条件之一,对于大数据的感知也是最急迫的。近年来,我国的智能交通已实现了快速发展,许多技术手段都达到了国际领先水平。但是,问题和困境也非常突出,从各个城市的发展状况来看,智能交通的潜在价值还没有得到有效挖掘:对交通信息的感知和收集有限,对存在于各个管理系统中的海量的数据无法共享运用、有效分析,对交通态势的研判预测乏力,对公众的交通信息服务很难满足需求。这虽然有各地在建设理念、投入上的差异,但是整体上智能交通的现状是效率不高,智能化程度不够,使得很多先进技术设备发挥不了应有的作用,也造成了大量投入上的资金浪费。这其中很重要的问题是小数据时代带来的硬伤:从模拟时代带来的管理思想和技术设备只能进行一定范围的分析,而管理系统的那些关系型数据库只能刻板的分析特定的关系,对于海量数据尤其是半结构、非结构数据无能为力。
尽管现在已经基本实现了数字化,但是数字化和数据化还根本不是一回事,只是局部的提高了采集、存储和应用的效率,本质上并没有太大的改变。而大数据时代的到来必然带来破解难题的重大机遇。大数据必然要求我们改变小数据条件下一味的精确计算,而是更好的面对混杂,把握宏观态势;大数据必然要求我们不再热衷因果关系而是相关关系,使得处理海量非结构化数据成为可能,也必然促使我们努力把一切事物数据化,最终实现管理的便捷高效。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26