京公网安备 11010802034615号
经营许可证编号:京B2-20210330
阿里巴巴公开大数据打假模式揭开神秘部门“神盾局“
100元的“耐克鞋”、1000元的“爱马仕包”你敢不敢买?去年“双11”,阿里巴巴集团创造了一天571亿元的销售奇迹,让人们意识到了电子商务带来的巨大财富。但阿里巴巴集团掌门人马云担心的是:“假货是阿里巴巴未来30年的最大挑战,阿里巴巴必须严肃地对待假货,采取所有的方法去打击假货”。
近几年来见诸报端的新闻显示,阿里给各地的公安机关提供了不少的线索。很多人都好奇,假货的线索是如何发现的?又如何能锁定造假的窝点和团伙身份?不久前,阿里首次公开大数据打假模式,揭开其神秘的部门——“神盾局”。
案件回放,“X光”扫描出假球衣
去年底,广州越秀区警方打掉两个团伙的5个线下运动服假货窝点,抓获犯罪嫌疑人9名。据初步预估,涉案金额达到2000万元。有意思的是,此案线索来自阿里“神盾局”。
案件回溯到2014年6月。世界杯的火热带动了运动品牌的热销,尤其是球衣。阿里方面加强了这些产品的筛查,后台的监控模型把每个商品的价格数据、投诉数据、商品描述数据纳入监控,每分钟就跟X光似的扫描一遍。其中,有几家店铺的品牌球衣信息异常,被系统识别为可疑。阿里方面根据系统识别的账号,分别进入店铺审查,发现这些商品描述中含糊品牌,实物照片也都没有正面图像,有些给品牌剪标打上马赛克。
“我们通过智能图像识别、数据抓取与交叉分析、智能追踪、大数据建模系统等技术,将假货从10亿量级的在线商品中捞取出来。”阿里内部人士称。据悉,淘宝收集的各类违规假货的图库约100万,系统每天调用超过3亿次,通过识别图片中商品的品牌,判断商品真伪。这些模型对淘宝数百万卖家进行实时评分,识别出具有售假风险的高危用户和售假团伙。
假货也有DNA追溯?
为了一探究竟,阿里的志愿买手买下嫌疑店铺的服装后交由品牌方验货,最终品牌方鉴定全部是假货。与此同时,阿里方面根据交易关联等信息,发现其中多个店铺的账号往来密切,经过进一步梳理查验,发现这背后很可能是两个线下售假团伙。
为了端掉线下窝点,阿里没有进行简单的封店操作,而是锁定了嫌疑人账号继续调查。最终锁定了嫌疑人所在区域是广州越秀区,并查到了嫌疑人的确切发货地址,但此时仍不能确定嫌疑人的具体身份。
于是,“神盾局”开始调用DNA认证系统。这听起来很奇怪,DNA常常是电影里用来做亲子鉴定的,假货也能追溯DNA?阿里巴巴安全部总监倪良表示,网店名字、ID可以多个注册,但是每个人的身份证号只有一个。在注册开淘宝店的时候,会经过18道审核,要求店主不但要上传手持身份证的照片,还要手持当天报纸(以防止使用买来或盗来图片)。这样的DNA系统可以对那些作弊者追根溯源。在确定了团伙位置、主犯身份后,阿里方面联系了广州越秀区警方。
阿里打假两年花10亿
虽然大数据打假看起来很酷,但是花费不菲。阿里巴巴首席风险官邵晓锋公布,阿里近两年在消费者保障及打假的投入已经超10亿元。去年前三季度,阿里配合品牌权利人年处理600万条侵权商品链接,配合各级行政执法部门,办理侵犯知识产权案件1000余起,抓获犯罪嫌疑人近400人,涉案金额近6亿元。
羊城晚报记者了解到,阿里目前投入在消费者保障及打假方面的员工超过2000人,阿里“神盾局”涵盖安全技术、数据挖掘、专案打击、品牌合作、消费者保障、投诉受理等数十项职能。此外,阿里还招募了5400多人的志愿者队伍,负责配合进行日常线上巡查和抽检等。
阿里还建立了知识产权线上维权通道——“IPR投诉平台”,目前已经有超过5.6万权利人注册使用。去年前三季度,该系统共受理了各类权利人投诉近54万单,删除近600万件涉嫌侵犯商标权、著作权及专利权的商品。
线下打假仍有难度
随着技术排查能力的升级,售假者也在不断变换手法。“大数据打假系统是在不断进化的,随着数据的丰富变得越来越聪明,但是售假也在不断找空子钻。”倪良表示,“今天最大的挑战,不只是在网上发现假货,而是怎么锁定假货背后的人,否则你今天把他的淘宝店关了,明天他换个马甲又冒出来了。”
邵晓峰表示,大数据智能识别原理不能全部公布,售假卖家也在规避被发现的手段。即使阿里通过大数据发现了卖家在涉假,要想证明对方真的是在售假,不一定能拿出证据。“这里面涉及到很多复杂的东西,攻防双方是在不断博弈的。”邵晓锋表示,不排除在将来发布“全国线下假货分布及流通地图”,并对重点区域、类目等信息进行注明,输出线下假货制造流通路径数据给相关合作部门,跟各地政府一起寻求帮助假货制造商转型的治理方法。
揭秘:神秘的“神盾局”
阿里巴巴低调神秘的安全部被内部人誉为“神盾局”。这个名字不由让人想到美剧《神盾局特工》。阿里巴巴作为中国最大的电商平台,拥有数百万级的商家,10亿级的商品,“神盾局”到底是干什么的?
●保护知识产权:说白了就是打假,这是“神盾局”最为重要的工作之一。
●保护账户安全:防止虚假注册。
●保护交易安全:主要是防止交易欺诈、恶意差评、敲诈勒索、打击炒信
●保护信息安全和禁限售排查
●保护隐私防止信息泄露
“神盾局”的大神们
除了常规的技术人员,“神盾局”里很多“特工”身怀绝技。
●知名“白帽子”
阿里吸纳了很多在安全攻防的白帽子界响当当的人物:肖力(安全攻防领域资深专家)、吴瀚清(《白帽子讲安全》作者,江湖上声名显赫的道哥)、魏兴国(网络安全领域知名专家,人称“云舒”)。以及知名的技术专家潘爱民(互联网底层技术专家)、刘嘉伟(知名架构师),他们捍卫着整个阿里巴巴体系安全攻防的基础,每天防御拦截数亿次的黑客攻击。
●原公检法系统的精英
“神盾局”有20多人曾经就职于政法系统,之前做过公安的有十几位,有干过二三十年刑警的;还有经验丰富的经侦、技侦、网监等警种的警界精英加盟。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10