京公网安备 11010802034615号
经营许可证编号:京B2-20210330
从计算广告看大数据和人工智能的关系
一、计算广告是大数据问题中的一支;二、大数据技术在计算广告中的应用:受众定向的冷启动和数据驱动的投放决策;三、从计算广告到理解“人工智能”。
本文系亿欧智库原创,以下基于笔者从书籍《计算广告》及相关市场信息研究得出,错误和偏颇之处在所难免。请大家多多指正批评。
不了解计算广告,就不可能深入地了解互联网,因为广告为全世界互联网行业贡献了大部分收入;其次,不了解计算广告,也不太容易真正理解大数据,因为计算广告是大数据最早落地的应用,也是到目前为止唯一获得规模化营收的应用。
一、计算广告,大数据问题中的一支;
如上图所示,C类曲线只需通过少量采样就能达到问题的目标函数,此为传统数据处理问题,一般统计报表、报告归属此类;A类曲线代表的数据问题不同于C类的少量采样就能达到全量数据的效果,解决问题的收益与数据采样率的高低呈强正相关关系,A类曲线绘制的便是大数据问题;B类处于A类和C类中间,少量采样有明显的收益效果,一旦超过一定范围则收益效果不那么明显。
由此可以总结出,如果有的数据处理问题无法通过数据采样的方法来降低处理的复杂程度,就必须利用一些专门为海量数据处理而设计的计算架构和存储技术来实现,此类数据处理问题称之为大数据问题。
计算广告需要用到每一个人的行为进行定制化推送,而无法单靠对小部分个体的采样来完成,因此归类为大数据问题。计算广告是大数据问题中的一支。
二、大数据技术在计算广告中的应用;
计算广告的核心问题,是为一系列用户与环境的组合找到最合适的广告投放策略以优化整体广告活动的利润。在线广告区别于传统线下广告的最大特点体现在计算优化和可衡量的效果。大数据技术在计算广告中的应用主要体现在计算优化上,具体为受众定向的冷启动、以及数据驱动的投放决策。
受众定向的冷启动;
广告最初的定向标签往往都设置在较粗的粒度上,最典型的是一些人口属性标签。按照广告本身就是一项服务业的本质来看,受众定向显然更符合需求方的口味和利益,也是受众定性推动着市场向着精细化运作的方向快速发展。
如上所示为计算广告受众定向的几种方法,其中人口属性这些定向的数据除非有特别的来源,如实名制SNS的注册信息或在线购物的消费记录等,一般情况下要进行准确的定向并不容易,所以利用好已知人口属性的用户作训练集,构造分类器对人口属性进行自动标注。
数据驱动的投放决策;
与工业革命时期机器化的根本驱动力——电力相类比,互联网化的根本驱动力可以认为是数据的深入加工和利用。在线广告的计算技术在很大程度上也要依赖于对于数据的大规模利用。广泛收集用户的行为数据和广告反馈数据,利用云计算的基础设施对用户打上合适的标签,同样根据数据在多个广告竞争同一次展示时做出决策,再将投放的结果统计数据反馈给广告操作人员以调整投放策略,此为计算广告的基本投放逻辑,可以认为,在线广告系统就是一个大数据处理平台,对数据处理的规模和响应速度的要求都相当高。
三、从计算广告到理解“人工智能”;
就目前情况来看,深度学习技术在计算广告上取得的提高,没有语音图像这些领域那样显著。这里面规律性的解释是,语音图像识别是对自然现象的数据收集和处理,我们完全可以通过主动的语料收集,让各色传感器都做到充分的覆盖,这是一个基本确定、变化不快的数据空间;而计算广告面对的社会现象数据是一个由千万网民反馈、快速变化的数据空间,即使对同一个人、同一则广告、同一个广告位,点击与否是一个很不确定的时间,而这样的不确定性即使引入再多的上下文信息也无法消除。
从狭义层面来理解人工智能便是“大数据+自动化”的产物,“自动化”依赖从标注数据中寻得y=f的规律模型来完成下一个的识别,狭义人工智能是建立在海量的数据基础之上的,也就是现下火热的深度学习和大数据有着非常紧密的联系。
而普罗大众所期待的广义人工智能,是要做到像人类一样面对任何不确定环境都能凭借种类各异的思考方式来试图给出解决方案。
松鼠没有像人类一样拥有种类各异的思考方式,但即使在几年之后,它依然可以精确记住几千个橡子所在的具体位置,这种技能就能甩人类好几条街了。人工智能也很类似,我们完全可以把计算器当成算数天才,计算广告利用狭义人工智能的存储力和计算力,在对人类各色标签记忆的完整度也已经超过了人类,在竞价环节的实时数据反馈也交上了令人满意的答卷,但面对不确定环境的决策能力,其实人类也没有教给它,所以广义的人工智能即通用人工智能,机器远不及人类。
也许换个层面来理解智能,这不是一个单一维度的概念,有的智能或许非常复杂,包含许多象征各种思维模式的子节点,还有的或许较为简单,但却发挥到了极端,处在可能性空间的角落位置。我们可以将智能视作一套生态系统,不同思维模式的节点相互依赖、共创共生。
人工智能在中国已经掀起了新一轮技术创新的浪潮,我们如何去感受人工智能的风向标?技术、创新、应用如何突破?未来人工智能这片蓝海怎么去航行?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10