
数据机器人帮你创造大数据商业价值
在大数据概念似乎与每个公司乃至每个人都紧密相关的今日,如果有人问大数据到底是什么?怎样才能让大数据为我创造实实在在的价值?大部分时候,你所得到的答案或者艰涩难懂,或者虚无缥缈,比如说3V(Volume(容量)、Velocity(速度)和Variety(多樣性)),甚至是5V (再加上Veracity(真實性)和Value(價值)),又或者“结构化数据”和“半结构化数据”。上到天体太空,下到海底勘探,大到教育文化,小到细胞DNA,总有一款可以迷惑你。
或许真相是,想在在大数据时代乘风破浪勇夺先机,你根本不需要知道这些。中国有句老话,术业有专攻。从大数据到商业价值,你需要的只是根据业务经验提出需求和目标,其他的一切都可以交给数据机器人来搞定。
听起来像是一个神话?其实这一切已经在发生。
“让天下没有难用的数据,让人人都可以成为数据科学家。”是桃树科技创始人最初的理想。桃树科技起源于2015年,其创始人杨滔和汪秦宇均为海归博士,在美中两国顶级互联网及金融公司具有资深的大数据技术和管理经验,因为看准了大数据领域全自动建模预测这一趋势,毅然放弃稳定高薪的大公司职位,转而投身创业这一荆棘艰险之旅。
如前文提到,大数据似乎可以在各个领域落地,但是能真正产生爆发效应的领域却并不多。根据多年的大数据应用经验,桃树选择了金融和电商大数据应用为公司起步的切入点。在金融领域,数据应用的需求属于刚需。尤其银行对贷款客户信用的评估关系到银行坏账率的比例。在电商领域,大数据应用可以产生规模化效应,形成数据积累的闭环,最终带动流量的获取。
信用风险评估机器人:CAN
“极客看什么不顺眼,就自己动手做一个。”以数据极客自诩的杨滔这样说,“大数据应用的广泛诉求,就是输入数据,输出结果。”于是他创造了第一个数据机器人CAN。CAN是一个专门应用于金融行业的风险评估机器人。在以民生银行为代表的多家知名银行和互联网金融机构中,都已经存在CAN的身影。当你给这台机器输入散落在各个角落的原始数据,它便如同一匹永不疲惫的战马夜以继日地飞奔,输出银行/p2p中申请贷款客户的信用打分及每个客户的风险点。这台机器,可以提早发现这些金融机构贷款业务中90%以上的贷款坏账,并且可以提早预测客户是否逾期归还贷款,预测准确率均在80%以上。传统的银行风险建模一般一个数据团队工作3到6个月,而CAN只需要3天。
无论是数据的清洗整理,还是算法的复杂处理,都是CAN的内在机制。对于银行客户经理,CAN提供的数据结果无比简单——客户经理负责客户的信用风险打分及对应的风险因子。CAN建立了这个数据提炼机制之后,自然把外部大量数据与内部数据动态整合,整合后的风险数据不仅包括客户的基本信息、金融行为、动态还款行为,并且还包括客户以及他的网络关系对应的央行征信数据、法院工商数据、房产资产数据以及在P2P平台上的贷款及表现数据等。从脏乱复杂的大数据到包含丰富预测信息的大数据,正是CAN的输入和输出。
当客户经理负责客户出现风险,他将第一时间获得风险预警,并可以根据CAN输出的风险因子去追踪事实真相。对于银行客户经理,大数据经过CAN的处理,成为在他们日常业务流程中的“决策抓手”。大数据远在天边,也近在眼前。
商品销量预测机器人:BOB
在CAN被多家银行客户高度认可之后,杨滔又带领他的团队开发了桃树机器人工厂的第二个机器人BOB。BOB是一款选品机器人,它可以基于商品的行业、类目、关键字、款式、价格、产地和营销渠道数据,预测商品在一定流量中,不同的场景、时间下,可获得的成交额(或转化率)。
电商运营的第一个环节就是选品。选品包括商品采购、营销活动爆款筛洗、商品排序规则等。B2C选品好坏直接关系库存积压,电商平台选品好坏直接关系流量分配机制,淘宝卖家如果无法打造爆款根本获得不到流量,导购网站其实也就是一个选品系统。传统电商选品主要依赖行业经验,运营人员通过对不同行业的经验来判断什么商品会卖得好。这种运营方式的局限在于难以规模化,并且还有腐败可能性。并且,在互联网上,所有商品信息都不是孤立的,消费者往往会比价,从多个电商平台找到性价比最优的商品。因此,综合电商自身与外部数据的选品,才有可能满足消费者需求。
选品机器人BOB的诞生,直击电商行业发展的基础痛点:1. 商家面对十几亿海量商品,不知如何选则适合自己平台的客群的商品; 2. 除了淘宝京东这样的大型平台,一般的中小电商迷失在海量数据中,缺乏利用数据帮助运营的知识。这些中小电商,在互联网时代依旧依赖传统的人工经验判断来进行决策,效率低下;3. 电商数据应用的技术门槛极高,商家面临大量非结构化文本数据,图像数据,中小卖家却往往没有能力建立数据科学团队,无法充分利用大数据帮助决策。
这一切问题,BOB都可以全自动化的解决。BOB起源于利用机器学习技术建立大规模商品销量预测模型。此模型成功帮助电商巨头淘宝旗下的聚划算平台实现数据化运营,挖掘爆款,提升运营效率80%,提升销售额235%。桃树科技成立的短短数月间,已经与多家电商网站展开洽谈,并与新兴电商网站街蜜以及风趣海淘签署了服务协议。
桃树的梦想,是让天下没有难用的数据,让人人都可以成为数据科学家。
在执着追寻这个梦想的路上,杨滔带领着他的团队不断壮大着他们的机器人工厂,这些机器人个个武艺高超,兼备从数据源自动清洗数据,抽取特征,并自动学习、预测、解释及强化自我的能力。它们内置了世界顶级数据科学家的智慧精华,拥有让数据价值最大化的计算程序,可以模拟数据科学家工作流,肩负着将各行各业的大数据高效率转化为商业价值的使命。
阿姆斯特朗踏上月球时曾经说过:“这是一个人的一小步,却是人类的一大步。”如今,人类凭着对知识无穷尽的渴望与狂热,已经迈出了一步又一步。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键 ...
2025-06-092025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27