京公网安备 11010802034615号
经营许可证编号:京B2-20210330
Yahoo的大数据分析的个人化应用_数据分析师培训
大数据(Big Data)近年来已成为市场关注焦点,为了能够发掘大数据的商业价值,在基础建设已经渐渐完备,数据搜集及储存能力已然成熟的环境下,大数据应用的探索焦点,已逐渐从数据技术与系统的讨论,逐渐转移到数据的分析与各领域的深化应用。
如目前的入口网站早已是许多人日常生活不可或缺的服务提供者,透过使用者在使用入口网站服务的行为分析,业者不但可以更进一步地提供个人化推荐服务,还可能为相关业者找到更多的商机。
但并非所有的数据都能产生价值,必须透过很多生态系统搭配组合,才能产生用户所需要的资讯。
大数据已成市场关注焦点。数据的确需要去开采,也需要技术及工具,但技术及工具也可能会用错或浪费资源,所以技术人员不能只看技术,而是要去理解数据真正的价值所在。
如健康照护服务及定位数据如果加以混搭,虽然可以提供更进一步的价值,但如何说动使用者开放或分享,其实需要更细致的说服过程。此外,大数据分析所呈现的世界,客户需求会更加清晰,但市场区隔也会变小,产品及服务必须要更加客制化。
随着无线网路、行动装置及物联网的时代来临,人与物的连结将变得更加多样化,也创造出更多各类型的数据,如何管理、维护及分析这些数据,并将正确分析的结果即时传给正确的使用者,创造更多的商业价值,势必将成为企业未来非常重要的竞争力,大数据分析的价值,值得加以重视。
大数据分析的个人化应用
网际网路基础建设渐趋成熟,加上行动装置的便利性及普及,让许多人的日常生活行为,已经离不开网路,其中又以入口网站接触到的使用者最多,也成为大数据的最主要来源。
如Yahoo提供的诸多服务,如电子信箱、购物、新闻、理财等,都可以追踪到消费者的足迹,加上使用者其他的网路使用行为如点击广告等,以及全球每月可收集超过16亿只智慧型手机及平板电脑上的使用者行为,如何进一步分析这些个人化应用,已成为重要议题。资讯及选择太多,其实也是大数据分析所遭遇的一大难题,以Yahoo所能追踪的消费者使用足迹为例,就会发现其实跟一般官网可以追踪的足迹不太一样,由此也可知,大数据与一般数据其实仍有差别,不能用同样的思考或方法来分析。
大数据具有5大特性,包括数据量(volume)、速度(velocity)、多样性(variety)、易变性(variability)及真实性(veracity)。其中数据量、速度及多样性这3项是一般较常用来评估大数据的标准。
由于使用者平日在网路的应用习惯,举凡使用搜寻引擎、即时通讯、看影音节目、气象、听音乐、购物、社群活动、上传相片、电邮及阅读新闻,Yahoo都有提供对应的服务,其中光是使用者接触到的媒体内容、电子商务及数位行销广告的使用行为分析,就可以产生非常大的商业价值。在分析大数据时,Yahoo一定会做好个人隐私保护,只有行为数据才是真正可以分析的行为。例如,光是早餐的麦片种类就超过70种,往往会造成消费者选择的困扰,但如果透过适当的使用者经验分析,就能提升使用者的正面体验。
以一个小资女班族的日常生活为例,早上在搭捷运上班途中,打开手机看新闻,透过大数据分析,就会优先提供这位使用者平常阅读的影剧新闻、近期因为想要旅游而常关注的旅游文章,以及最近热门浏览的财经新闻。
透过大数据分析使用者行为,也能让使用者得到更多相关资讯。如使用者在点击购物中心84折运动的资讯时,网站就会提示使用者之前看过的那些商品,其实也适用此活动。
甚至在使用者因为点选了广告推荐的日本秋季赏枫行程,个人化推荐模组就会显示超级商城的冬季新装长大衣,或是日本零食、美妆等商品资讯。而且当使用者下班后经过药妆店时,超级商城App也会提供有限定商品折扣的讯息,而且凭App产生的条码,到店购买就可享有第二件7折优惠。
Yahoo首页每天分析超过1亿个以上的网路使用行为,才能提供使用者最感兴趣的互动,而且使用者的网路使用行为愈多,Yahoo提供的资讯也会愈精准。
而对厂商而言,精准行销广告本来就会有提高广告投资效益的效果,如果能根据使用者行为,在首页出现相关的广告,或提示相关的行销活动,抓到使用者的需求,销售将会成倍数成长,尤其是个人化模组的促销量,效果又会比网站推荐模组的效果更好。
针对电子商务,Yahoo台湾团队自主研发演算法与归纳消费者行为模式进行分群,透过数百群产品推荐模组,提供更优质的个人化服务,让购物中心来自个人化推荐模组的业绩显着增加。电子商务方向的大数据分析经验,发现使用者对于即时性的要求很高,也就是说,使用者的任何行为,要在10几分钟后就能完成分析,提供进一步的建议。
要做到前述的使用者行为分析,其实需要各种数据分析技术支援,如分析消费者各类行为与需求的预测模型,也要有能力即时侦测互动事件,并回馈产生最佳的个人化服务内容,而具备一个能够从互动产生的大数据中,快速地搜集、储存、撷取、汇整与计算的大数据分析平台,更是其中的关键要素。
大数据分析平台的运作过程,必须先要有数据来源,然后透过Hadoop、Shark及SQL等技术,很快地完成数据分析处理,最后再将结果储存并展示在使用者的面前。此外,大数据要做到个人化分析应用,科学建模(Science Modeling)的重要性不言可喻,科学建模依据的数学或科学理论,透过雅虎的实际工程(Practical Engineering)及适应学习(Adaptive Learning)能力,可以具体实践出成果。大数据分析要做到个人化应用,批次讯号及即时讯号的分析技术,两者无法相互替代,必须相辅相成,再透过分群数据技术及个人化引擎,最后才能提供为使用者个人量身订做的专属建议。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04