数据机器人帮你创造大数据商业价值
在大数据概念似乎与每个公司乃至每个人都紧密相关的今日,如果有人问大数据到底是什么?怎样才能让大数据为我创造实实在在的价值?大部分时候,你所得到的答案或者艰涩难懂,或者虚无缥缈,比如说3V(Volume(容量)、Velocity(速度)和Variety(多樣性)),甚至是5V (再加上Veracity(真實性)和Value(價值)),又或者“结构化数据”和“半结构化数据”。上到天体太空,下到海底勘探,大到教育文化,小到细胞DNA,总有一款可以迷惑你。
或许真相是,想在在大数据时代乘风破浪勇夺先机,你根本不需要知道这些。中国有句老话,术业有专攻。从大数据到商业价值,你需要的只是根据业务经验提出需求和目标,其他的一切都可以交给数据机器人来搞定。
听起来像是一个神话?其实这一切已经在发生。
“让天下没有难用的数据,让人人都可以成为数据科学家。”是桃树科技创始人最初的理想。桃树科技起源于2015年,其创始人杨滔和汪秦宇均为海归博士,在美中两国顶级互联网及金融公司具有资深的大数据技术和管理经验,因为看准了大数据领域全自动建模预测这一趋势,毅然放弃稳定高薪的大公司职位,转而投身创业这一荆棘艰险之旅。
如前文提到,大数据似乎可以在各个领域落地,但是能真正产生爆发效应的领域却并不多。根据多年的大数据应用经验,桃树选择了金融和电商大数据应用为公司起步的切入点。在金融领域,数据应用的需求属于刚需。尤其银行对贷款客户信用的评估关系到银行坏账率的比例。在电商领域,大数据应用可以产生规模化效应,形成数据积累的闭环,最终带动流量的获取。
信用风险评估机器人:CAN
“极客看什么不顺眼,就自己动手做一个。”以数据极客自诩的杨滔这样说,“大数据应用的广泛诉求,就是输入数据,输出结果。”于是他创造了第一个数据机器人CAN。CAN是一个专门应用于金融行业的风险评估机器人。在以民生银行为代表的多家知名银行和互联网金融机构中,都已经存在CAN的身影。当你给这台机器输入散落在各个角落的原始数据,它便如同一匹永不疲惫的战马夜以继日地飞奔,输出银行/p2p中申请贷款客户的信用打分及每个客户的风险点。这台机器,可以提早发现这些金融机构贷款业务中90%以上的贷款坏账,并且可以提早预测客户是否逾期归还贷款,预测准确率均在80%以上。传统的银行风险建模一般一个数据团队工作3到6个月,而CAN只需要3天。
无论是数据的清洗整理,还是算法的复杂处理,都是CAN的内在机制。对于银行客户经理,CAN提供的数据结果无比简单——客户经理负责客户的信用风险打分及对应的风险因子。CAN建立了这个数据提炼机制之后,自然把外部大量数据与内部数据动态整合,整合后的风险数据不仅包括客户的基本信息、金融行为、动态还款行为,并且还包括客户以及他的网络关系对应的央行征信数据、法院工商数据、房产资产数据以及在P2P平台上的贷款及表现数据等。从脏乱复杂的大数据到包含丰富预测信息的大数据,正是CAN的输入和输出。
当客户经理负责客户出现风险,他将第一时间获得风险预警,并可以根据CAN输出的风险因子去追踪事实真相。对于银行客户经理,大数据经过CAN的处理,成为在他们日常业务流程中的“决策抓手”。大数据远在天边,也近在眼前。
商品销量预测机器人:BOB
在CAN被多家银行客户高度认可之后,杨滔又带领他的团队开发了桃树机器人工厂的第二个机器人BOB。BOB是一款选品机器人,它可以基于商品的行业、类目、关键字、款式、价格、产地和营销渠道数据,预测商品在一定流量中,不同的场景、时间下,可获得的成交额(或转化率)。
电商运营的第一个环节就是选品。选品包括商品采购、营销活动爆款筛洗、商品排序规则等。B2C选品好坏直接关系库存积压,电商平台选品好坏直接关系流量分配机制,淘宝卖家如果无法打造爆款根本获得不到流量,导购网站其实也就是一个选品系统。传统电商选品主要依赖行业经验,运营人员通过对不同行业的经验来判断什么商品会卖得好。这种运营方式的局限在于难以规模化,并且还有腐败可能性。并且,在互联网上,所有商品信息都不是孤立的,消费者往往会比价,从多个电商平台找到性价比最优的商品。因此,综合电商自身与外部数据的选品,才有可能满足消费者需求。
选品机器人BOB的诞生,直击电商行业发展的基础痛点:1. 商家面对十几亿海量商品,不知如何选则适合自己平台的客群的商品; 2. 除了淘宝京东这样的大型平台,一般的中小电商迷失在海量数据中,缺乏利用数据帮助运营的知识。这些中小电商,在互联网时代依旧依赖传统的人工经验判断来进行决策,效率低下;3. 电商数据应用的技术门槛极高,商家面临大量非结构化文本数据,图像数据,中小卖家却往往没有能力建立数据科学团队,无法充分利用大数据帮助决策。
这一切问题,BOB都可以全自动化的解决。BOB起源于利用机器学习技术建立大规模商品销量预测模型。此模型成功帮助电商巨头淘宝旗下的聚划算平台实现数据化运营,挖掘爆款,提升运营效率80%,提升销售额235%。桃树科技成立的短短数月间,已经与多家电商网站展开洽谈,并与新兴电商网站街蜜以及风趣海淘签署了服务协议。
桃树的梦想,是让天下没有难用的数据,让人人都可以成为数据科学家。
在执着追寻这个梦想的路上,杨滔带领着他的团队不断壮大着他们的机器人工厂,这些机器人个个武艺高超,兼备从数据源自动清洗数据,抽取特征,并自动学习、预测、解释及强化自我的能力。它们内置了世界顶级数据科学家的智慧精华,拥有让数据价值最大化的计算程序,可以模拟数据科学家工作流,肩负着将各行各业的大数据高效率转化为商业价值的使命。
阿姆斯特朗踏上月球时曾经说过:“这是一个人的一小步,却是人类的一大步。”如今,人类凭着对知识无穷尽的渴望与狂热,已经迈出了一步又一步。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03