从计算广告看大数据和人工智能的关系
一、计算广告是大数据问题中的一支;二、大数据技术在计算广告中的应用:受众定向的冷启动和数据驱动的投放决策;三、从计算广告到理解“人工智能”。
本文系亿欧智库原创,以下基于笔者从书籍《计算广告》及相关市场信息研究得出,错误和偏颇之处在所难免。请大家多多指正批评。
不了解计算广告,就不可能深入地了解互联网,因为广告为全世界互联网行业贡献了大部分收入;其次,不了解计算广告,也不太容易真正理解大数据,因为计算广告是大数据最早落地的应用,也是到目前为止唯一获得规模化营收的应用。
一、计算广告,大数据问题中的一支;
如上图所示,C类曲线只需通过少量采样就能达到问题的目标函数,此为传统数据处理问题,一般统计报表、报告归属此类;A类曲线代表的数据问题不同于C类的少量采样就能达到全量数据的效果,解决问题的收益与数据采样率的高低呈强正相关关系,A类曲线绘制的便是大数据问题;B类处于A类和C类中间,少量采样有明显的收益效果,一旦超过一定范围则收益效果不那么明显。
由此可以总结出,如果有的数据处理问题无法通过数据采样的方法来降低处理的复杂程度,就必须利用一些专门为海量数据处理而设计的计算架构和存储技术来实现,此类数据处理问题称之为大数据问题。
计算广告需要用到每一个人的行为进行定制化推送,而无法单靠对小部分个体的采样来完成,因此归类为大数据问题。计算广告是大数据问题中的一支。
二、大数据技术在计算广告中的应用;
计算广告的核心问题,是为一系列用户与环境的组合找到最合适的广告投放策略以优化整体广告活动的利润。在线广告区别于传统线下广告的最大特点体现在计算优化和可衡量的效果。大数据技术在计算广告中的应用主要体现在计算优化上,具体为受众定向的冷启动、以及数据驱动的投放决策。
受众定向的冷启动;
广告最初的定向标签往往都设置在较粗的粒度上,最典型的是一些人口属性标签。按照广告本身就是一项服务业的本质来看,受众定向显然更符合需求方的口味和利益,也是受众定性推动着市场向着精细化运作的方向快速发展。
如上所示为计算广告受众定向的几种方法,其中人口属性这些定向的数据除非有特别的来源,如实名制SNS的注册信息或在线购物的消费记录等,一般情况下要进行准确的定向并不容易,所以利用好已知人口属性的用户作训练集,构造分类器对人口属性进行自动标注。
数据驱动的投放决策;
与工业革命时期机器化的根本驱动力——电力相类比,互联网化的根本驱动力可以认为是数据的深入加工和利用。在线广告的计算技术在很大程度上也要依赖于对于数据的大规模利用。广泛收集用户的行为数据和广告反馈数据,利用云计算的基础设施对用户打上合适的标签,同样根据数据在多个广告竞争同一次展示时做出决策,再将投放的结果统计数据反馈给广告操作人员以调整投放策略,此为计算广告的基本投放逻辑,可以认为,在线广告系统就是一个大数据处理平台,对数据处理的规模和响应速度的要求都相当高。
三、从计算广告到理解“人工智能”;
就目前情况来看,深度学习技术在计算广告上取得的提高,没有语音图像这些领域那样显著。这里面规律性的解释是,语音图像识别是对自然现象的数据收集和处理,我们完全可以通过主动的语料收集,让各色传感器都做到充分的覆盖,这是一个基本确定、变化不快的数据空间;而计算广告面对的社会现象数据是一个由千万网民反馈、快速变化的数据空间,即使对同一个人、同一则广告、同一个广告位,点击与否是一个很不确定的时间,而这样的不确定性即使引入再多的上下文信息也无法消除。
从狭义层面来理解人工智能便是“大数据+自动化”的产物,“自动化”依赖从标注数据中寻得y=f的规律模型来完成下一个的识别,狭义人工智能是建立在海量的数据基础之上的,也就是现下火热的深度学习和大数据有着非常紧密的联系。
而普罗大众所期待的广义人工智能,是要做到像人类一样面对任何不确定环境都能凭借种类各异的思考方式来试图给出解决方案。
松鼠没有像人类一样拥有种类各异的思考方式,但即使在几年之后,它依然可以精确记住几千个橡子所在的具体位置,这种技能就能甩人类好几条街了。人工智能也很类似,我们完全可以把计算器当成算数天才,计算广告利用狭义人工智能的存储力和计算力,在对人类各色标签记忆的完整度也已经超过了人类,在竞价环节的实时数据反馈也交上了令人满意的答卷,但面对不确定环境的决策能力,其实人类也没有教给它,所以广义的人工智能即通用人工智能,机器远不及人类。
也许换个层面来理解智能,这不是一个单一维度的概念,有的智能或许非常复杂,包含许多象征各种思维模式的子节点,还有的或许较为简单,但却发挥到了极端,处在可能性空间的角落位置。我们可以将智能视作一套生态系统,不同思维模式的节点相互依赖、共创共生。
人工智能在中国已经掀起了新一轮技术创新的浪潮,我们如何去感受人工智能的风向标?技术、创新、应用如何突破?未来人工智能这片蓝海怎么去航行?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03