京公网安备 11010802034615号
经营许可证编号:京B2-20210330
Yahoo的大数据分析的个人化应用_数据分析师培训
大数据(Big Data)近年来已成为市场关注焦点,为了能够发掘大数据的商业价值,在基础建设已经渐渐完备,数据搜集及储存能力已然成熟的环境下,大数据应用的探索焦点,已逐渐从数据技术与系统的讨论,逐渐转移到数据的分析与各领域的深化应用。
如目前的入口网站早已是许多人日常生活不可或缺的服务提供者,透过使用者在使用入口网站服务的行为分析,业者不但可以更进一步地提供个人化推荐服务,还可能为相关业者找到更多的商机。
但并非所有的数据都能产生价值,必须透过很多生态系统搭配组合,才能产生用户所需要的资讯。
大数据已成市场关注焦点。数据的确需要去开采,也需要技术及工具,但技术及工具也可能会用错或浪费资源,所以技术人员不能只看技术,而是要去理解数据真正的价值所在。
如健康照护服务及定位数据如果加以混搭,虽然可以提供更进一步的价值,但如何说动使用者开放或分享,其实需要更细致的说服过程。此外,大数据分析所呈现的世界,客户需求会更加清晰,但市场区隔也会变小,产品及服务必须要更加客制化。
随着无线网路、行动装置及物联网的时代来临,人与物的连结将变得更加多样化,也创造出更多各类型的数据,如何管理、维护及分析这些数据,并将正确分析的结果即时传给正确的使用者,创造更多的商业价值,势必将成为企业未来非常重要的竞争力,大数据分析的价值,值得加以重视。
大数据分析的个人化应用
网际网路基础建设渐趋成熟,加上行动装置的便利性及普及,让许多人的日常生活行为,已经离不开网路,其中又以入口网站接触到的使用者最多,也成为大数据的最主要来源。
如Yahoo提供的诸多服务,如电子信箱、购物、新闻、理财等,都可以追踪到消费者的足迹,加上使用者其他的网路使用行为如点击广告等,以及全球每月可收集超过16亿只智慧型手机及平板电脑上的使用者行为,如何进一步分析这些个人化应用,已成为重要议题。资讯及选择太多,其实也是大数据分析所遭遇的一大难题,以Yahoo所能追踪的消费者使用足迹为例,就会发现其实跟一般官网可以追踪的足迹不太一样,由此也可知,大数据与一般数据其实仍有差别,不能用同样的思考或方法来分析。
大数据具有5大特性,包括数据量(volume)、速度(velocity)、多样性(variety)、易变性(variability)及真实性(veracity)。其中数据量、速度及多样性这3项是一般较常用来评估大数据的标准。
由于使用者平日在网路的应用习惯,举凡使用搜寻引擎、即时通讯、看影音节目、气象、听音乐、购物、社群活动、上传相片、电邮及阅读新闻,Yahoo都有提供对应的服务,其中光是使用者接触到的媒体内容、电子商务及数位行销广告的使用行为分析,就可以产生非常大的商业价值。在分析大数据时,Yahoo一定会做好个人隐私保护,只有行为数据才是真正可以分析的行为。例如,光是早餐的麦片种类就超过70种,往往会造成消费者选择的困扰,但如果透过适当的使用者经验分析,就能提升使用者的正面体验。
以一个小资女班族的日常生活为例,早上在搭捷运上班途中,打开手机看新闻,透过大数据分析,就会优先提供这位使用者平常阅读的影剧新闻、近期因为想要旅游而常关注的旅游文章,以及最近热门浏览的财经新闻。
透过大数据分析使用者行为,也能让使用者得到更多相关资讯。如使用者在点击购物中心84折运动的资讯时,网站就会提示使用者之前看过的那些商品,其实也适用此活动。
甚至在使用者因为点选了广告推荐的日本秋季赏枫行程,个人化推荐模组就会显示超级商城的冬季新装长大衣,或是日本零食、美妆等商品资讯。而且当使用者下班后经过药妆店时,超级商城App也会提供有限定商品折扣的讯息,而且凭App产生的条码,到店购买就可享有第二件7折优惠。
Yahoo首页每天分析超过1亿个以上的网路使用行为,才能提供使用者最感兴趣的互动,而且使用者的网路使用行为愈多,Yahoo提供的资讯也会愈精准。
而对厂商而言,精准行销广告本来就会有提高广告投资效益的效果,如果能根据使用者行为,在首页出现相关的广告,或提示相关的行销活动,抓到使用者的需求,销售将会成倍数成长,尤其是个人化模组的促销量,效果又会比网站推荐模组的效果更好。
针对电子商务,Yahoo台湾团队自主研发演算法与归纳消费者行为模式进行分群,透过数百群产品推荐模组,提供更优质的个人化服务,让购物中心来自个人化推荐模组的业绩显着增加。电子商务方向的大数据分析经验,发现使用者对于即时性的要求很高,也就是说,使用者的任何行为,要在10几分钟后就能完成分析,提供进一步的建议。
要做到前述的使用者行为分析,其实需要各种数据分析技术支援,如分析消费者各类行为与需求的预测模型,也要有能力即时侦测互动事件,并回馈产生最佳的个人化服务内容,而具备一个能够从互动产生的大数据中,快速地搜集、储存、撷取、汇整与计算的大数据分析平台,更是其中的关键要素。
大数据分析平台的运作过程,必须先要有数据来源,然后透过Hadoop、Shark及SQL等技术,很快地完成数据分析处理,最后再将结果储存并展示在使用者的面前。此外,大数据要做到个人化分析应用,科学建模(Science Modeling)的重要性不言可喻,科学建模依据的数学或科学理论,透过雅虎的实际工程(Practical Engineering)及适应学习(Adaptive Learning)能力,可以具体实践出成果。大数据分析要做到个人化应用,批次讯号及即时讯号的分析技术,两者无法相互替代,必须相辅相成,再透过分群数据技术及个人化引擎,最后才能提供为使用者个人量身订做的专属建议。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05