
大数据应用需接行业“地气” 金融一体机破题
大数据到底有多热?从春运大数据、春晚大数据到“两会”上对大数据国家战略的热烈讨论,就这样,大数据从一个技术市场的热词,恍然间“似如一夜春风来,飞入寻常百姓家”。
技术市场中,关于大数据究竟是“新瓶装旧酒”还是“颠覆式创新引擎”的讨论从未停歇。实际上,当蕴含在数据生命周期中的信息价值得以充分释放时,没有人会关心其背后的技术究竟是“大数据”抑或是其他。现实生活中人们所经历的是各种看得见或看不见的“大数据果实”,例如购物网站上的各种关联推荐、商场中的货品陈列、基于数据的个性化服务衍生品等,甚至包括“哪里的啤酒与炸鸡最好?”这样的潮流趋势。
互联网金融的实质—大数据2014年春节,“微信红包”与支付宝“让红包飞”一时瑜亮,其风头一定让人们淡忘了当年疯狂滥炸的“收礼只收脑白金”,成功占领各种信息渠道的头条位置。与再一次被推到舆论风口浪尖的“互联网金融”一道,传统金融业的服务创新再次成为所有人热议的焦点。毕竟,以微信红包为例,它交出了这样的答卷:从除夕至大年初一16时,参与抢红包用户过500万,总计抢红包7500万次以上;总领取数超2000万个,平均每分钟领取达9.4万个……
交易数据、信用数据、社交数据、移动数据等,蕴藏在这些数据资产背后的,是想象无边界的、巨大的“信息宝藏”。谁能够更好地掌握、分析这些数据,谁就能更好地挖掘数据背后的商业价值,实现点数成“金”。在这方面,互联网公司是“探路者”也是“先行者”,传统行业的产品、服务创新将紧随其后,说到底,大数据是背后的推手。
作为我国最早完成信息化建设的行业,金融业多年来积累了相当庞大的数据。近年来,金融行业自身客户数据、交易数据、风险管理数据以及来自于网络的数据呈爆发式增长,大数据应用前景十分广阔。
然而,如何借鉴互联网金融的成功之处,利用大数据技术创新金融业务和模式,是众多金融机构一直在思考的问题。传统金融行业业务链长、业务环节多,带来了数据量大、分散、异构的现状。一方面,通过采用虚拟化、分布式计算、存储技术,跨越组织架构、业务体系局限,用大数据实现业务转型和服务创新已势在必行;另一方面,大数据技术市场上存在众多技术流派,带来硬件、软件等各方面的技术兼容性问题,导致在大数据的部署、业务开发和运维等环节,用户面临建设周期长、自行调试、二次开发难度高等问题。
银行大数据内力不足邬贺铨院士表示:“实际上所有银行本身都是大数据的企业。”据统计数据表明,银行的平均数据存储量是各行业中最高的,国内银行结构化数据平均年增长量约100TB,接近国外的二十分之一,非结构化数据约1PB.其中,工行的企业级数据仓库存储量超过350TB,积累的数据超4.5PB;中行、建行、银联、交行、华夏、邮政等等也有很大的数据量。
银行可以利用这些海量数据来做些什么呢?麦肯锡公司认为,基于大数据,银行可以把贷款客户份额增加一倍,贷款损失减少四分之一。目前,大数据在银行业的风险管理方面有很广泛的应用,如交行太平洋信用卡中心采用了自动信贷审批决策引擎,优质账户平均余额和利息收入增加20%和10%,审批效率提高30%;工行在采用大数据进行风险管理后,全行日均手工监督工作量由859.8万笔降低到5.4万笔,全行释放了5900余名业务监督人员。
大数据也能有效降低银行的客户流失率。招行通过数据分析识别出招行信用卡高价值客户经常出现在星巴克、DQ、麦当劳等场所后,通过“多倍积分累计”、“积分店面兑换”等活动吸引优质客户;通过构建客户流失预警模型,对流失率等级前 20%的客户发售高收益理财产品予以挽留,使得金卡和金葵花卡客户流失率分别降低了15 %和 7%.不过,银行业的大数据收集与分析能力仍需加强,特别是在语音分析、视频分析、流分析以及位置分析等方面,银行与其他行业的平均水平还存在着较大差距。
从传统结构化数据的分析应用,到行业内部整合的多结构类型大数据处理,再到未来的跨部门、跨行业的数据整合分析,“我们正处于行业内异构数据共享和价值释放的阶段,并在未来相当长的时间都会处在这个阶段。”浪潮集团高级副总裁王恩东指出,“这个阶段,会有大量的新技术和新产品涌现,无论是硬件还是软件。对于产业链上下游的系统厂商、行业ISV来说,这都是难得的‘历史新机遇’。”
当通用技术不足以支撑行业业务流程再造和价值释放时,结合行业需求特点,进行技术和产品的整合和优化不啻为一种比较现实可行的做法。日前,浪潮集团与国内领先的金融信息化解决方案供应商南天信息联合推出浪潮云海金融大数据一体机,这是国内市场第一款面向金融行业大数据应用的一体化产品。据了解,目前该系统已经在某国有商业银行完成历史查询业务的实测,测试结果表现优异。
大数据行业应用接“地气”
针对大数据市场的定位和分析,浪潮的策略可谓“两手抓,两手都要硬”。一方面,浪潮在基础软硬件平台上持续加大研发投入,并将一些关键技术移植到一体机产品上。另一方面,不断建立和深化与国内大型ISV的合作,完善产业布局,已经成为浪潮大数据战略的重要策略。开放、灵活的基础平台与行业应用相结合,形成一体化方案,能够有效帮助用户跨过大数据应用的“门槛”,进而创造新的业务价值。
据了解,基于分布式开放架构的浪潮云谷系统软件,云海金融大数据一体机采用了Share Nothing架构设计,具有弹性扩展、即付即用、性能强劲、安全可靠四大特点,其应用了FPGA加速技术、SSD加速缓存技术等多项优化技术实现了整体性能的大幅提升,数据导入速度可达到每秒百万条,随机查询速度更是高达每秒百亿条,比业界平均性能水平提升了20%.而Share Nothing架构设计,则让系统能够灵活扩展到4000节点,达到了顶级互联网企业的大数据技术实现能力。
同时,云海金融大数据一体机应用了诸多基于浪潮天梭K1的主机安全技术,拥有自主研发的50多项发明专利和2项软件著作权,RAS特性超过20项,而模块化的安全体系设计和操作系统安全增强系统,则确保产品符合国家信息安全等级保护第三级认证标准。
大数据一体机、一体机系统软件、大数据行业定制机,作为最早推出大数据平台化解决方案的国产厂商,浪潮的大数据策略脉络清晰,产品足够“接地气”。当基础平台与行业应用充分嫁接时,数据流转和价值变现将从真正意义上脱离“纸上谈兵”的阶段,大数据应用走向行业纵深,“以数据为中心,推动行业应用从数据向服务转型”的梦想将照进现实。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09