京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们用“大数据”做空_数据分析师考试
不是标题党,确有其事,不过不是我们做空,是我们帮助客户做空,那还是我在律师事务所做专职律师时候的事。
大家如果对反垄断法有一定的了解的话,就知道如果两个(或以上)企业之间发生集中(比如兼并收购),且参与集中的企业达到一定的规模(比如营业额达到一定的标准),那么这个集中就必需先申报(比如在中国向商务部进行申报),待申报被批准后方能实施集中。反垄断申报的目的在于防止一个集中会破坏一个相关市场的竞争秩序,从而损害消费者的利益。举个例子,如果可口可乐和百事可乐集中合并为一个企业,那么这个集中就极有可能导致可乐市场的竞争秩序被扭曲和破坏——可乐市场的竞争因为两个主要竞争者的消逝而消逝了,那么可乐的价格就极有可能飙升,从而损害消费者的利益。
如果可口可乐和百事可乐要集中合并的话,那么这个集中合并一定得去相关市场的政府部门申报,与此同时就会有很多券商、对冲基金或者其他人来决定是否做多还是做空这两个公司的股票。如果这个集中被批准的可能性较大,那么做多这两个公司股票的基本面就大——虽然集中可能损害消费者利益,但对两个公司而言是利好,这两个公司的股价就会上涨,因此做多的赢面大。反言之,如果这个集中被拒绝的可能性较大,那么做空这两个公司股票的基本面就大——因为集中申报一旦被拒绝,那么参与集中的公司的股票就会下跌,因此做空的赢面大。当然我用这两个可乐巨头来举例可能太过典型而不具实际意义,因为它们的集中被否几乎就是板上钉钉的事。那我们就用一个实战例子来说事。不过这个例子还是与可口可乐有关。
2008年9月3日,可口可乐宣布计划以现金收购中国汇源果汁集团有限公司(01886.HK)。可口可乐公司建议收购要约为每股12.20港元,并等价收购已发行的可换股债券及期权。可口可乐在宣布之前已取得汇源三个股东签署的接受要约不可撤销承诺,三个股东共拥有汇源66%股份。如此项建议交易获得接纳, 可口可乐付出的对价约24亿美元。该交易若完成,将成为可口可乐到当时为止在中国金额最大的一笔收购交易,汇源果汁也将撤市。
上述消息宣布之后,汇源与可口可乐的股价均大幅上扬。但问题是可口可乐对汇源的收购属于中国反垄断法下应当予以申报的一次集中,该集中是否能得到商务部的批准成为这次交易的X因素,对此有对冲基金找到我们做分析,我们按照我们做此类业务的套路和方法收集了相关数据进行分析(至于是什么样的数据和什么样的分析方法我们在此就不说了)。不管怎样,我们最终的分析结果是商务部反垄断局将不会批准这次集中,幸运的是我们这次分析结果是正确的。相应地,听从我们的建议而做空的客户也就赚了钱。
7年前我们在做上述案例分析的时候,还没有所谓“大数据”或者“小数据”的概念。现在回过头来想想,我们当时(和现在)所做的无非也就是数据分析,当然了,所涉及的数据从总量上看也许不是那么地大,但是相对于具体项目而言已经足够大。当然,是不是一定可以把这些数据看成我们现而今所称的“大数据”也许值得商榷,我们以后另行撰文来讨论,这也是我在本文标题中把“大数据”加上引号的原因。不管怎样,考虑到商务部迄今为止在所有的 1000多件反垄断申报案件中只有2个未获申报,我们当时对概率如此之小的事件能够准确地预判还是令人值得骄傲的,这应当归功于我们收集数据的准确与分析的到位。
如果我们可以把上述成功做空看成是采用“大数据”所做的一个有效分析的话,那么“大数据”分析似乎具有以下几个特点,我们在这里就所谓的特点试图做一个归纳以达到抛砖引玉的目的:
- 大数据分析首先应当是商品。不管数据采集和分析的方法是怎样的,最后出来的产品应当有人化钱购买。没有商业价值的大数据或大数据分析产品是没有价值的,换言之是做不下去的。
-大数据分析产品的开发应当有针对性的客户。不同的客户对大数据分析产品的需求是不一样的。就拿法律行业的上述大数据为例,对大数据及大数据分析产品有直接需求的基本上是做涉外业务的律师事务所及国际大公司,所以上述大数据及大数据分析产品的工作语言基本上都是英语。
- 大数据分析的生命力在于它的准确性。以我们上述案件为例,可口可乐收购汇源被否,汇源股价在紧接着开盘的当天全天暴跌42%。而在这之前可口可乐天价收购汇源的消息曾刺激汇源股价狂飙近200倍。可口可乐在宣布收购汇源果汁之后,其在纽约证交所的股价曾一度出现强劲上升,但在后来的半年里股价下降了20%,这与其收购汇源失败不是没有关联的。可以想象如果我们当时的分析是不准确的,那么客户就得赔钱了。当然,我们这个案件的成功不能不说有一定的偶然性,那么大数据分析是不是有一定的容错?我相信是有的。如果大数据不会犯错,那其就等同于上帝了,但大数据的错误率太高,那么也就没有商业价值,甚至连娱乐价值也都没有了。
在文章最后问一个问题:用数据(不管是大还是小)分析出来的结论来做空算不算是恶意呢?也许这个问题有点“然并卵”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18