京公网安备 11010802034615号
经营许可证编号:京B2-20210330
阿里巴巴公开大数据打假模式揭开神秘部门“神盾局“
100元的“耐克鞋”、1000元的“爱马仕包”你敢不敢买?去年“双11”,阿里巴巴集团创造了一天571亿元的销售奇迹,让人们意识到了电子商务带来的巨大财富。但阿里巴巴集团掌门人马云担心的是:“假货是阿里巴巴未来30年的最大挑战,阿里巴巴必须严肃地对待假货,采取所有的方法去打击假货”。
近几年来见诸报端的新闻显示,阿里给各地的公安机关提供了不少的线索。很多人都好奇,假货的线索是如何发现的?又如何能锁定造假的窝点和团伙身份?不久前,阿里首次公开大数据打假模式,揭开其神秘的部门——“神盾局”。
案件回放,“X光”扫描出假球衣
去年底,广州越秀区警方打掉两个团伙的5个线下运动服假货窝点,抓获犯罪嫌疑人9名。据初步预估,涉案金额达到2000万元。有意思的是,此案线索来自阿里“神盾局”。
案件回溯到2014年6月。世界杯的火热带动了运动品牌的热销,尤其是球衣。阿里方面加强了这些产品的筛查,后台的监控模型把每个商品的价格数据、投诉数据、商品描述数据纳入监控,每分钟就跟X光似的扫描一遍。其中,有几家店铺的品牌球衣信息异常,被系统识别为可疑。阿里方面根据系统识别的账号,分别进入店铺审查,发现这些商品描述中含糊品牌,实物照片也都没有正面图像,有些给品牌剪标打上马赛克。
“我们通过智能图像识别、数据抓取与交叉分析、智能追踪、大数据建模系统等技术,将假货从10亿量级的在线商品中捞取出来。”阿里内部人士称。据悉,淘宝收集的各类违规假货的图库约100万,系统每天调用超过3亿次,通过识别图片中商品的品牌,判断商品真伪。这些模型对淘宝数百万卖家进行实时评分,识别出具有售假风险的高危用户和售假团伙。
假货也有DNA追溯?
为了一探究竟,阿里的志愿买手买下嫌疑店铺的服装后交由品牌方验货,最终品牌方鉴定全部是假货。与此同时,阿里方面根据交易关联等信息,发现其中多个店铺的账号往来密切,经过进一步梳理查验,发现这背后很可能是两个线下售假团伙。
为了端掉线下窝点,阿里没有进行简单的封店操作,而是锁定了嫌疑人账号继续调查。最终锁定了嫌疑人所在区域是广州越秀区,并查到了嫌疑人的确切发货地址,但此时仍不能确定嫌疑人的具体身份。
于是,“神盾局”开始调用DNA认证系统。这听起来很奇怪,DNA常常是电影里用来做亲子鉴定的,假货也能追溯DNA?阿里巴巴安全部总监倪良表示,网店名字、ID可以多个注册,但是每个人的身份证号只有一个。在注册开淘宝店的时候,会经过18道审核,要求店主不但要上传手持身份证的照片,还要手持当天报纸(以防止使用买来或盗来图片)。这样的DNA系统可以对那些作弊者追根溯源。在确定了团伙位置、主犯身份后,阿里方面联系了广州越秀区警方。
阿里打假两年花10亿
虽然大数据打假看起来很酷,但是花费不菲。阿里巴巴首席风险官邵晓锋公布,阿里近两年在消费者保障及打假的投入已经超10亿元。去年前三季度,阿里配合品牌权利人年处理600万条侵权商品链接,配合各级行政执法部门,办理侵犯知识产权案件1000余起,抓获犯罪嫌疑人近400人,涉案金额近6亿元。
羊城晚报记者了解到,阿里目前投入在消费者保障及打假方面的员工超过2000人,阿里“神盾局”涵盖安全技术、数据挖掘、专案打击、品牌合作、消费者保障、投诉受理等数十项职能。此外,阿里还招募了5400多人的志愿者队伍,负责配合进行日常线上巡查和抽检等。
阿里还建立了知识产权线上维权通道——“IPR投诉平台”,目前已经有超过5.6万权利人注册使用。去年前三季度,该系统共受理了各类权利人投诉近54万单,删除近600万件涉嫌侵犯商标权、著作权及专利权的商品。
线下打假仍有难度
随着技术排查能力的升级,售假者也在不断变换手法。“大数据打假系统是在不断进化的,随着数据的丰富变得越来越聪明,但是售假也在不断找空子钻。”倪良表示,“今天最大的挑战,不只是在网上发现假货,而是怎么锁定假货背后的人,否则你今天把他的淘宝店关了,明天他换个马甲又冒出来了。”
邵晓峰表示,大数据智能识别原理不能全部公布,售假卖家也在规避被发现的手段。即使阿里通过大数据发现了卖家在涉假,要想证明对方真的是在售假,不一定能拿出证据。“这里面涉及到很多复杂的东西,攻防双方是在不断博弈的。”邵晓锋表示,不排除在将来发布“全国线下假货分布及流通地图”,并对重点区域、类目等信息进行注明,输出线下假货制造流通路径数据给相关合作部门,跟各地政府一起寻求帮助假货制造商转型的治理方法。
揭秘:神秘的“神盾局”
阿里巴巴低调神秘的安全部被内部人誉为“神盾局”。这个名字不由让人想到美剧《神盾局特工》。阿里巴巴作为中国最大的电商平台,拥有数百万级的商家,10亿级的商品,“神盾局”到底是干什么的?
●保护知识产权:说白了就是打假,这是“神盾局”最为重要的工作之一。
●保护账户安全:防止虚假注册。
●保护交易安全:主要是防止交易欺诈、恶意差评、敲诈勒索、打击炒信
●保护信息安全和禁限售排查
●保护隐私防止信息泄露
“神盾局”的大神们
除了常规的技术人员,“神盾局”里很多“特工”身怀绝技。
●知名“白帽子”
阿里吸纳了很多在安全攻防的白帽子界响当当的人物:肖力(安全攻防领域资深专家)、吴瀚清(《白帽子讲安全》作者,江湖上声名显赫的道哥)、魏兴国(网络安全领域知名专家,人称“云舒”)。以及知名的技术专家潘爱民(互联网底层技术专家)、刘嘉伟(知名架构师),他们捍卫着整个阿里巴巴体系安全攻防的基础,每天防御拦截数亿次的黑客攻击。
●原公检法系统的精英
“神盾局”有20多人曾经就职于政法系统,之前做过公安的有十几位,有干过二三十年刑警的;还有经验丰富的经侦、技侦、网监等警种的警界精英加盟。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17