
大数据分析激活产业链
马云在给阿里巴巴员工的一封内部邮件中说,以控制为出发点的IT时代正在走向激活生产力为目的的DT(data technology)数据时代。随着计算机技术的发展,大数据运算变得越来越现实,基于大数据应用服务的公司不断崭露头角。大数据在营销领域的应用将广告变成了“窄告”——精准营销,而在互联网金融大热的背景下,大数据在金融业征信方面的应用也在逐渐兴起。
人人都是“数据动物”
不同于“天空中没有留下鸟的痕迹,但我已飞过”,人们不论是网上聊天、购物还是浏览网页、发微信、微博,都会或多或少留下记录,这些记录以数据的形式被存储下来。随着移动互联网的迅猛发展,无论在何时、何地、何处,手机等各种网络入口以及无处不在的传感器等都会对个人数据进行采集、存储、使用、分享。而大量的数据结合起来,通过分析,不难还原出一个人的“样子”——数据化的形象。
很多人在浏览网页时都有这样的体验,网站上的广告位所出现的广告往往是自己最近浏览过的产品,或是最近搜索过的内容,这背后就是大数据在营销上应用。
北京集奥聚合科技有限公司就是一家大数据服务提供商,公司推出的DataQuate解决方案主要用于解决运营商大数据的接入、挖掘及应用,为运营商大数据的价值转化提供端到端服务。
集奥聚合所做的正是通过大数据的挖掘,帮助广告主更精准地进行广告投放。据集奥聚合CMO段培力介绍,公司通过系统地对海量的、碎片化的网络用户行为数据进行梳理,采用科学的分类法和特征模型进行数据挖掘及用户建模,最大程度逼真还原“用户画像”,分析获得用户多维度信息,实现数据的商业价值。
尽管这样的广告很大程度上具有一定滞后性,但相比于过去“漫天撒网”式的广告投放,在精准性上已经有了较大程度的提升。段培力表示,用户数据的“新鲜”程度,直接影响到用户的回复率。数据对于用户兴趣判定的准确性会随着时间迅速降低,因为该浏览者很可能已经完成了一次购买行为。因而数据光是有量还远远不够,数据方还必须保证时效性。
此外,目前的大数据技术多将数据还原到某一终端,基于PC端的数据由于无法区分具体的数据源自一人或多人,也可能出现不够精确的情况。不过,随着移动互联网的普及,手机终端的一对一特性,则为大数据追踪到具体用户创造了条件。段培力认为,现有的大数据基础加上实时数据分析,甚至数据源的动态跟踪,将有助于广告的推送更加精准并具有前瞻性。
事实上,大数据的商业应用远远不止营销这一个领域,集奥聚合新近开发了针对互联网金融的个人征信数据产品。“实际上不管是营销还是征信,数据的搜集方法都是一样的,只是数据输出的维度不同。” 段培力介绍说。
数据分析激活产业链
根据IDC过去五年的研究,全球数据量大约每两年翻一番。然而,大数据产业链上常常出现一个怪相:有数据的公司不知道怎么用,需要数据的公司又没有足够的数据来源,或分析数据的技术。在这种背景下,大量大数据服务公司产生,它们通过大数据技术从各种各样类型的数据中快速获得有价值的信息,并提供给需要数据的公司。
作为建设和管理数据管道的运营商,在大数据领域有天然的资源优势。以一个省级电信运营商为例,每天能产生70~100TB的数据量,几十亿次点击的上网记录。运营商已经认识到信息资产的价值含量,并正在着手建设其用户数据仓库。不过,由于行业应用与数据运营的经验有限,运营商需要面向应用的数据挖掘,需要数据的价值转化工具和运营层面的战略合作伙伴。
据业内人士介绍,根据所提供价值的不同来源,目前主要有三种大数据公司。三种数据来源是指:数据本身、技能与思维。
基于数据本身的公司往往拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。例如微博等社交网络和运营商。前文所提到的集奥聚合则属于基于技能的公司。这些公司能够进行不同程度的大数据整理和分析,提供给需要数据的公司使用。而基于大数据思维的公司,则通过现有数据的加工,创造性地为用户提供更具价值的想法和建议。这些公司成功的关键不在于占有多少数据和分析数据的技能,而是其创新的思路。
阿里巴巴的金融业务就是基于其数据资产进行商业创新的重要成果。阿里巴巴在金融业的全面布局已经对传统银行、保险、小贷等多个行业形成冲击,尤其在技术、模式和思维上已经形成巨大的冲击,且将推动金融产业格局的重构。而这也正是马云宣称要“摇一摇”传统金融的基础。
一位正在大数据领域创业的人士告诉中国证券报记者,他所从事的大数据业务将为金融企业提供有关个人的数据化行为分析,并进行评级,以推动金融产品的差别定价。例如,给予个人信用好的贷款人更低的贷款利率;或给驾驶行为良好的有车族提供更低的车险保费。
隐私保护的矛盾
隐私问题一直是越来越社交化的互联网争论的热点,而大数据时代则将这一争论进一步推向高潮。大数据来自于具体的网络行为,作为做出这些行为的个人,最关心的当然是自己的隐私数据会不会被泄露和滥用。
据媒体报道,欧洲议会的一项研究报告表示:云计算大数据已经对个人隐私造成了比想象中更加严重的威胁。该报告还称:云计算的隐私威胁被低估了。大数据时代现有的技术手段保护对于个人隐私而言远远不足,除了要建立健全个人隐私保护的法律法规和基本规则之外,鼓励隐私保护技术的研发、创新和使用,从技术层面来保障隐私安全,完善用户保障体系。
据段培力介绍,集奥聚合所采用的是非cookies(访问网络时储存在用户本地终端上的数据)数据,不仅能够更全面地进行受众描述,也有助于保护用户隐私信息。“在网络上,其实有很多地方都属于‘公共场合’,比如网店、网站公开信息等,用户在这些区域产生的数据是我们主要使用的。”
据了解,集奥聚合在隐私安全方面拥有独家首创的核心技术,公司采用三级数据安全技术全面保障用户数据的隐私安全。第一级采用集奥聚合大数据采集解决方案,在数据源头消除用户隐私;第二级采用大数据挖掘和价值应用解决方案,系统间通过IPSEC隧道协议通信,具有不可否认性、发重播性、数据完整性、数据可靠性和认证功能;第三级采用大数据挖掘解决方案,运维支撑系统通过SSL隧道协议维护挖掘系统,具有身份识别和数据加密功能。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01