京公网安备 11010802034615号
经营许可证编号:京B2-20210330
阿里巴巴公开大数据打假模式揭开神秘部门“神盾局“
100元的“耐克鞋”、1000元的“爱马仕包”你敢不敢买?去年“双11”,阿里巴巴集团创造了一天571亿元的销售奇迹,让人们意识到了电子商务带来的巨大财富。但阿里巴巴集团掌门人马云担心的是:“假货是阿里巴巴未来30年的最大挑战,阿里巴巴必须严肃地对待假货,采取所有的方法去打击假货”。
近几年来见诸报端的新闻显示,阿里给各地的公安机关提供了不少的线索。很多人都好奇,假货的线索是如何发现的?又如何能锁定造假的窝点和团伙身份?不久前,阿里首次公开大数据打假模式,揭开其神秘的部门——“神盾局”。
案件回放,“X光”扫描出假球衣
去年底,广州越秀区警方打掉两个团伙的5个线下运动服假货窝点,抓获犯罪嫌疑人9名。据初步预估,涉案金额达到2000万元。有意思的是,此案线索来自阿里“神盾局”。
案件回溯到2014年6月。世界杯的火热带动了运动品牌的热销,尤其是球衣。阿里方面加强了这些产品的筛查,后台的监控模型把每个商品的价格数据、投诉数据、商品描述数据纳入监控,每分钟就跟X光似的扫描一遍。其中,有几家店铺的品牌球衣信息异常,被系统识别为可疑。阿里方面根据系统识别的账号,分别进入店铺审查,发现这些商品描述中含糊品牌,实物照片也都没有正面图像,有些给品牌剪标打上马赛克。
“我们通过智能图像识别、数据抓取与交叉分析、智能追踪、大数据建模系统等技术,将假货从10亿量级的在线商品中捞取出来。”阿里内部人士称。据悉,淘宝收集的各类违规假货的图库约100万,系统每天调用超过3亿次,通过识别图片中商品的品牌,判断商品真伪。这些模型对淘宝数百万卖家进行实时评分,识别出具有售假风险的高危用户和售假团伙。
假货也有DNA追溯?
为了一探究竟,阿里的志愿买手买下嫌疑店铺的服装后交由品牌方验货,最终品牌方鉴定全部是假货。与此同时,阿里方面根据交易关联等信息,发现其中多个店铺的账号往来密切,经过进一步梳理查验,发现这背后很可能是两个线下售假团伙。
为了端掉线下窝点,阿里没有进行简单的封店操作,而是锁定了嫌疑人账号继续调查。最终锁定了嫌疑人所在区域是广州越秀区,并查到了嫌疑人的确切发货地址,但此时仍不能确定嫌疑人的具体身份。
于是,“神盾局”开始调用DNA认证系统。这听起来很奇怪,DNA常常是电影里用来做亲子鉴定的,假货也能追溯DNA?阿里巴巴安全部总监倪良表示,网店名字、ID可以多个注册,但是每个人的身份证号只有一个。在注册开淘宝店的时候,会经过18道审核,要求店主不但要上传手持身份证的照片,还要手持当天报纸(以防止使用买来或盗来图片)。这样的DNA系统可以对那些作弊者追根溯源。在确定了团伙位置、主犯身份后,阿里方面联系了广州越秀区警方。
阿里打假两年花10亿
虽然大数据打假看起来很酷,但是花费不菲。阿里巴巴首席风险官邵晓锋公布,阿里近两年在消费者保障及打假的投入已经超10亿元。去年前三季度,阿里配合品牌权利人年处理600万条侵权商品链接,配合各级行政执法部门,办理侵犯知识产权案件1000余起,抓获犯罪嫌疑人近400人,涉案金额近6亿元。
羊城晚报记者了解到,阿里目前投入在消费者保障及打假方面的员工超过2000人,阿里“神盾局”涵盖安全技术、数据挖掘、专案打击、品牌合作、消费者保障、投诉受理等数十项职能。此外,阿里还招募了5400多人的志愿者队伍,负责配合进行日常线上巡查和抽检等。
阿里还建立了知识产权线上维权通道——“IPR投诉平台”,目前已经有超过5.6万权利人注册使用。去年前三季度,该系统共受理了各类权利人投诉近54万单,删除近600万件涉嫌侵犯商标权、著作权及专利权的商品。
线下打假仍有难度
随着技术排查能力的升级,售假者也在不断变换手法。“大数据打假系统是在不断进化的,随着数据的丰富变得越来越聪明,但是售假也在不断找空子钻。”倪良表示,“今天最大的挑战,不只是在网上发现假货,而是怎么锁定假货背后的人,否则你今天把他的淘宝店关了,明天他换个马甲又冒出来了。”
邵晓峰表示,大数据智能识别原理不能全部公布,售假卖家也在规避被发现的手段。即使阿里通过大数据发现了卖家在涉假,要想证明对方真的是在售假,不一定能拿出证据。“这里面涉及到很多复杂的东西,攻防双方是在不断博弈的。”邵晓锋表示,不排除在将来发布“全国线下假货分布及流通地图”,并对重点区域、类目等信息进行注明,输出线下假货制造流通路径数据给相关合作部门,跟各地政府一起寻求帮助假货制造商转型的治理方法。
揭秘:神秘的“神盾局”
阿里巴巴低调神秘的安全部被内部人誉为“神盾局”。这个名字不由让人想到美剧《神盾局特工》。阿里巴巴作为中国最大的电商平台,拥有数百万级的商家,10亿级的商品,“神盾局”到底是干什么的?
●保护知识产权:说白了就是打假,这是“神盾局”最为重要的工作之一。
●保护账户安全:防止虚假注册。
●保护交易安全:主要是防止交易欺诈、恶意差评、敲诈勒索、打击炒信
●保护信息安全和禁限售排查
●保护隐私防止信息泄露
“神盾局”的大神们
除了常规的技术人员,“神盾局”里很多“特工”身怀绝技。
●知名“白帽子”
阿里吸纳了很多在安全攻防的白帽子界响当当的人物:肖力(安全攻防领域资深专家)、吴瀚清(《白帽子讲安全》作者,江湖上声名显赫的道哥)、魏兴国(网络安全领域知名专家,人称“云舒”)。以及知名的技术专家潘爱民(互联网底层技术专家)、刘嘉伟(知名架构师),他们捍卫着整个阿里巴巴体系安全攻防的基础,每天防御拦截数亿次的黑客攻击。
●原公检法系统的精英
“神盾局”有20多人曾经就职于政法系统,之前做过公安的有十几位,有干过二三十年刑警的;还有经验丰富的经侦、技侦、网监等警种的警界精英加盟。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22