京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析师也是一个威胁的职业
今天 (一月二十三号)早上看到的第一个新闻,是两名第一资本(Capital One) 的前雇员,被美国证监会发起民事诉讼,指控用第一资本的内部数据从事内线交易,三年内获利将近两百八十万美元。
两名被告均为华裔,职位是数据分析师,已被第一资本解雇。
第一资本是美国最大的行用卡发行公司和银行之一,市值超过四百亿美元。公司拥有四千五百万信用卡和银行存款客户,因此掌握了大量实时的消费者的数据。由于数据海量,因此相对于美国整体经济,非常有代表性.
两名被告被指控利用职务之便,在第一资本的内部的客户数据库里进行大量搜索,研究170多家面向个人消费者的上市公司的销售数据,用此信息分析趋势,进行多次内部交易.
这 个故事发生在第一资本,我一点也不奇怪。我1994年曾经去第一资本在弗吉尼亚的总部面试分析师的职位,见到当时的公司总裁Nigel Morris. 我面试时印象最深的是影响信用卡公司利润最重要的两个因素。 一是减少坏账率,二是提高迟付账单的罚款金额(late fee).
1994 - 2004 年在Morris 领导下的十年,第一资本创造性地通过对用户大数据的挖掘,战略性地选择利润最高的客户,净利润每年增加超过30%,股票年均增长超过20%, 业绩远超其他信用卡公司.
当时由于阳光明媚的硅谷有更好的机会, 我婉言谢绝了他们开出的一年四万两千美元的低薪聘请,去加州发展,那是后话不表.
在美国证监会的指控诉讼书中,两名被告被控于2011年底,开了六个户头,用于期权交易.
期权,又叫选择权,是一种金融衍生产品,用来赌某只股票在某个固定时间之前会低于或者高于某个价格。 实际操作中,大部分投机者购买的期权,都会一钱不值。但偶尔时间把握得好,期权是一种可能以很少资金获取暴利的工具.
诉 讼里一个例子是户外活动产品公司,Cabela, 2014年初宣布将于二月十三号早市之前发布季度财报。被告被控于二月七号和八号在第一资本的内部数据库里搜索Cabela 的信用卡消费数据,并于财报公布前一天,二月十二号以五万多美元的资金购买大量短期期权,赌Cabela 股票下跌.
第二天财报公布后Cabela 股票价格下跌10%, 被告的期权价格翻了一番后被卖掉.
另外两笔交易中被告也使用类似的期权交易手段,其中在2014年六月通过购买快餐连锁店Chipotle 的短期期权,一天内回报37 万美元.
在过去二十年我耳闻目睹的各类内线交易案例中,大多是简单的,技术含量不太高的。一般被告主要是通过非法渠道,提前知道公司收购兼并,或者季度财报的消息,以此交易。像今天这个用第三方大数据分析,被控内线交易,应当是第一次.
这个诉讼目前有一些争议,有人认为被告不是直接获得公司内部消息,而是间接地通过第三方的信用卡销售数据来分析趋势,制定策略,所以不算严格的内线交易.
有人认为像第一资本这样大公司的内部客户数据,已经明显属于“关键性非公开资料”( material non-public information ) 的范畴,被告利用这些信息交易,明显违法.
也有人认为美国证监会只抓一些小虾米,对许多大基金游走在内线交易的边缘,获取暴利,视而不见.
两名被告已经丢了工作,在美国的资产已被冻结。不管诉讼结果如何,希望他们能够吸取教训,以后远离法律灰色地带,把才干施展在擅长的领域.
这个案例也给世界各地的监管机构,在法律上提出了新的挑战,尤其是面对那些在各行各业掌握海量实时大数据,拥有信息优势的企业.
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11