京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的秘密—社会化媒体的开放之路
大数据可以说是近来年最火热的一个话题。微博等社交化媒体因其独特的开放性特征,也成为大数据利用最令人关注的领域。
而这两年,随着微博、微信等社交平台商业化尝试的深入,及其结果的不尽如人意,大数据的利用成为了一个能否实现商业化实质突破的关键点。而这个点的关键又在于社交平台是否能做到对大数据的真正开放。
对于社交平台大数据开放,行业关注点现在主要在集中在两方面:其一是社交平台大数据究竟价值几何?其二,是基于这一大数据,平台方能给出怎样的的全面开放政策,以及这类政策的持续和稳定性又如何。
社交平台的数据价值
要了解社交平台大数据的价值,首先要搞清楚的是,开放平台合作伙伴们是如何利用这一大数据的。
化繁为简,我们将其概括为三步:首先是对平台所产生的庞大数据进行分析;然后,通过分析获得数据背后的用户诉求;最后,针对用户诉求进行个性化、精确化和智能化的信息推送和服务推广,并最终实现吸引用户点击、消费的目标。
举个简单例子,比如有用户在微博分享地理位置、景点等信息时,其广告模块就会快速精准的为其推荐相关的机票、酒店等信息。
而实现这一所有流程的起始点,就在于用户在社交网络上的生活化分享。而这也正是社交网络大数据的价值所在。
此外,企业通过社交大数据的分析和处理,还可以低成本的进行舆论监控,极大降低了企业品牌危机产生和扩散的可能。
社交平台的数据价值不言而喻。近日,新浪CTO许良杰在接受采访时就着重谈了大数据,并称“新浪微博作为社会化平台,最大的价值在于大数据”。
超5亿的用户群及每天产生各种信息便是新浪微博有价值的大数据。目前,其正基于此做多种商业化的尝试,但对这些尝试,业界评价似乎不是太高。
比如,包括粉丝通、Pagerank、淘宝广告等在内的基于大数据的产品尝试,皆一定程度上影响了用户体验,在利用数据的同时,产生了诸多垃圾数据,更降低了用户活跃度,对平台价值进行着侵蚀。
要知道,社交平台的数据价值指的并不单纯是用户数及用户信息等,而是基于其动态数据的挖掘、分析和以API接口的输出,及再利用。这需要诸多环节的协同与努力,而非平台方一家力所能及。
正如Facebook的工程总监Parikh所说:“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”
开放尺度定成败
大数据的价值只是基础,要实现智能营销,一个重要层面还在于第三方能从多大程度上利用到这一数据进行挖掘。
而这也包含了两个层面,首先是API开放多样性,其次是数据的完整性。
在API开放方面,一直以来行业对开放平台期待最多的公司要数新浪。新浪初期也的确不负众望,给予了第三方开发者近百个API接口,可谓相当丰富。在2012年前后,通过这些接口,也密集涌现出了很多基于新浪微博大数据的创业公司,盛况空前。
然而这种基于开放而联姻的蜜月期还没来得及令人回味,新浪对于API开放的态度却在近期发生了转变。如在去年,新浪微博便关闭了其开放平台的私信接口,今年更是对开放平台接口做了进一步收紧(对当前授权应用只能读取授权该应用的当前用户微博,不能获取其他用户微博;同时,当前授权应用只能读取授权该应用的当前用户的关系,不能读取其他用户的关系。)。
而这种收窄的姿态,在阿里巴巴入股新浪微博之后,愈趋明显。
众多开发者表示,其多款应用的数据已被清空或者api接口被停用。现在新浪开放平台的每次更新也是删的多,增的少,而增加的功能也大多都是可有可无的。
开发作为当下互联网的一个趋势(百度、阿里巴巴、腾讯【简称BAT】三巨头都在谈开放),新浪微博反其道而行之,当然,新浪对API开放性的收缩,我们要承认其一些深层次的因素考量。比如之前私信端口的开放,就造成大量垃圾信息对用户的骚扰;以及与阿里联姻后,来自阿里方面的诉求和压力等。
与此相比,一直以来不声不响的腾讯微博倒在开放平台上做出了不少动静。比如,国内唱吧、啪啪,国外cooliris都选择了腾讯微博,甚至IOS7系统也首次开放IOS-SDK给腾讯微博。
其次说到开放的完整性,所谓数据完整性就是当开发者请求某种数据时,开放平台是否对返回数据的数量有所限制。这点也最能反映出一个平台的真实开放程度。
以最基本的获取一个用户的”粉丝列表“为例,新浪,对于一般授权用户,最多只能获得5000个最新粉丝信息,而腾讯则没有任何的限制。
腾讯副总裁刘炽平曾在其内部讲话中曾提到:“关键路径要有用户价值,如果没有用户价值,这里放一个流量,那里放一个流量,价值不大。” 而这句话也正点明了大数据开放的本质应该是什么。
行业皆知,只有数据挖掘精准度在85%以上时,才具备实现精准营销的条件。如数据挖掘不够精准,就会直接影响到广告营销的投放效果。而数据不完整,数据挖掘的精准度只是空谈而已。
而数据完整开放的重要性,还不仅仅限于第三方开放者,对于社交平台本身,在提升用户体验方面也息息相关。
比如腾讯微博最近上线的微圈、微热点、微频道、微博管家等产品,就是通过数据挖掘技术,抽取用户阅读时间线中来自游戏、活动、第三方应用等营销和广告微博,并将其过滤,从而进一步减轻垃圾信息对于微博用户的骚扰,从而使用户更高效的获取优质微博信息,最终实现用户阅读体验的提升。
这种将大数据挖掘产品化的路子,应该说值得借鉴。因为一方面,它能比较充分的满足第三方开发者需求;更重要的是,这并不以影响用户端的产品体验为代价,实施得好的话,可形成一个良性闭环模式
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30数据透视表是数据分析中高效汇总、多维度分析数据的核心工具,能快速将杂乱数据转化为结构化的汇总报表。在实际分析场景中,我们 ...
2025-12-30在金融投资、商业运营、用户增长等数据密集型领域,量化策略凭借“数据驱动、逻辑可验证、执行标准化”的优势,成为企业提升决策 ...
2025-12-30CDA(Certified Data Analyst),是在数字经济大背景和人工智能时代趋势下,源自中国,走向世界,面向全行业的专业技能认证,旨 ...
2025-12-29在数据分析领域,周期性是时间序列数据的重要特征之一——它指数据在一定时间间隔内重复出现的规律,广泛存在于经济、金融、气象 ...
2025-12-29数据分析师的核心价值在于将海量数据转化为可落地的商业洞察,而高效的工具则是实现这一价值的关键载体。从数据采集、清洗整理, ...
2025-12-29在金融、零售、互联网等数据密集型行业,量化策略已成为企业提升决策效率、挖掘商业价值的核心工具。CDA(Certified Data Analys ...
2025-12-29CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26数字化浪潮席卷全球,数据已成为企业核心生产要素,“用数据说话、用数据决策”成为企业生存与发展的核心逻辑。在这一背景下,CD ...
2025-12-26箱线图(Box Plot)作为数据分布可视化的核心工具,凭借简洁的结构直观呈现数据的中位数、四分位数、异常值等关键信息,广泛应用 ...
2025-12-25在数据驱动决策的时代,基于历史数据进行精准预测已成为企业核心需求——无论是预测未来销售额、客户流失概率,还是产品需求趋势 ...
2025-12-25在数据驱动业务的实践中,CDA(Certified Data Analyst)数据分析师的核心工作,本质上是通过“指标”这一数据语言,解读业务现 ...
2025-12-25在金融行业的数字化转型进程中,SQL作为数据处理与分析的核心工具,贯穿于零售银行、证券交易、保险理赔、支付结算等全业务链条 ...
2025-12-24在数据分析领域,假设检验是验证“数据差异是否显著”的核心工具,而独立样本t检验与卡方检验则是其中最常用的两种方法。很多初 ...
2025-12-24