登录
首页精彩阅读大数据思维与电商技术创新_数据分析师
大数据思维与电商技术创新_数据分析师
2014-12-11
收藏

大数据思维与电商技术创新

我现在已经离开ebay了,ebay这个公司实际上在商业模式上比较保守的公司,对比一下你就能够知道它跟阿里巴巴的区别了。但是这几年ebay在技术上投入比较大,技术主要用在Buyer上了,比如说有很多技术怎么帮助买家猜测他的意图,卖家上,我怎么去帮助卖家把这个东西卖上去,比如说价格预测,分类。刘明为卖家服务这方面是做得非常突出和优秀的,我们经常一起聚会,他是我们的头。

    ebay这个公司应该说在商业模式上创新比较少,用我们时下比较流行的术语说就是“缺乏互联网思维”,但是在技术上投入是比较多的,应该说它这个大数据思维是有的。刚才刘明分享了很多“干货”,所以大家可以看我的题目,《大数据思维与电商技术创新》,一看就是一个比较忽悠的抬头,所以我讲的是比较忽悠的东西。我的背景比较杂,最早学的是数学,后来学了计算机,有三个硕士学位,一个博士学位,比较书呆,看的书比较多,但是做的比较少,所以比较忽悠。

    我是去年12月份回国的,为什么回国呢?有一个小故事。去年12月份的时候主持了一个国际数据挖掘的大会,是一个比较好的大会。当时我们邀请了一些嘉宾,包括ebay公司管技术的副总,还有百度的深度学习部门的副总,百度的副总在那里演讲说我们这里做深度学习,去年7月份立项,11月份就有几个项目上线了,当时我们副总一听太奇怪了,在我们那里光是讨论光是立项可能就要半年,人家4个月已经出东西了,我说当然,中国是很有活力的,你只是看到这个,如果你用一下我们中国出的一些新软件,微信、来往,支付宝等等,你要用这些软件就会发现美国的软件弱爆了,那他说你为什么还在这里?我跟他相视一笑,那个大会开完的第二周,我们副总离职了,我也离职了,副总离职不是我干的(笑)。
    子遨问我讲什么,我就跟他说讲“大数据思维和电商技术创新”,结果前两天我上微信一看的,下面这段很流行了,说“化缘的改叫众筹了,办公室出租改叫孵化器了,放高利贷的改叫资本运作了,忽悠的叫互联网思维了,统计改叫大数据分析”。我一看到这个,我想我还讲不讲这个,太忽悠了。后来我用我的逻辑思考了一下,这里面两个东西都很像,但它们并不是统计的东西,所以我觉得还是可以过来忽悠一下。
    在讲正题之前,大家该给我看看我这个表弟应该干啥?张三他非常腼腆,少言寡语,他很乐于助人,但对他人或者这个现实世界没有兴趣,他恭谨有礼,做事井井有条,中规中矩,他喜欢整理物件,家里东西摆放很齐整。张三更可能从事下面两个职业中的哪一个?是图书管理员还是打工仔?你如果是直觉来思考的话,觉得他可能是图书管理员,因为我们直觉是不懂统计的。如果你稍微考虑一下你会发现,中国打工仔有几亿,图书管理员有几个。如果你考虑统计的话,你就会发现这个他更可能成为打工仔。这个在心理学中有论述,人的思维有很多很多偏差,这个是其中一种偏差,叫相似形启发偏差。直觉告诉我们这个人描述跟图书管理员很相似,所以我们觉得他可能做图书管理员,直觉是不懂统计的。像我刚才读的那段话,直觉告诉我们好象是那么回事,是因为直觉是不会深入思考。

    大家看这个,这是一个漩涡图吗?它不是,实际上很多同心圆在这里,所以这里告诉视觉也是有偏差的。
    给你们讲一个故事,是美国的故事,说人死了之后要进天堂,天堂不是什么人都可以进的,有人看守的,你要进就要回答一个问题,是一个听写的单词。这时候一个白人进来了,守门人就说,你帮我拼写一下上帝这个单词,很简单嘛。这时候来了一个黑人,说你帮我拼写一个捷克斯洛伐克这个单词,黑人傻眼了。所以这告诉我们,人做决策的时候,都是有立场的偏差的。你无论是多么理性的人,都或多或少的有偏差
    这个故事很有意思,说以色列有8位保释官,每天工作都是审理保释申请。保释申请很多,他们每天除了三餐就在审理,每份保释申请需要6分钟,平均通过率是35%。这时候就有美国的科学家帮他们去做数据分析,结果数据出来让所有人都非常惊讶,为什么?他们发现当保释官吃完饭坐下刚开始批的时候,批准率有65%,慢慢随着时间过去,批准率稳步下降。到了他们即将下班或到了他们下一顿饭到来之前,批准率几乎为零。所以这告诉我们,人的思维是有多大的偏差,很受生理等各方面的影响。
    这本书我强烈推荐一下,就是《思考,快与慢》,它讲的所谓快思维就是直觉,慢思维就是理性思维。
    讲了这么多,我们想说一个很简单的问题,人的思维有各种各样的偏差,我们要做决策、要做创新、要做管理,如果只依赖于我们人的思维的话,是不行的。那怎么办?就要数据化,在大数据时代,我们要有大数据的思维。这种思维对我们中国人来说,可能是更加重要。因为历史上很多人都说,我们中国人是“差不多”先生,什么事都差不多就好,不会去深入分析背后的原因,也不会去搞一些数据分析。像中国讨论问题的时候都会说我的经验告诉应该怎么样?美国一些受过比较好训练的人就会说你把数据给我。重视数据是必然的,现在也是也到了这样一个时代,随着各种传感器、手机,移动互联网的盛行,很多东西都数据化了,有句话说一切皆可数量化。数量化之后我们就要开始考虑怎么样让我们收集到的数据让它说话?
    比如说我们收集到的一些数据,我们来看看这个例子,说某宝网站上有两个商家,他们都做成了一千宗生意,这是数据告诉我们的,A店铺是客户好评是20%,B店铺客户好评率是80%,某位“亲”要买这两个店铺都提供的商品,应该选哪个店铺?直觉告诉我应该选好评率高的,80%,干嘛选20%的?现在淘宝系统也是这样,我们去看某一个商品,看到了店铺商品符合率有多少,好评率有多少?都给这种数据。实际上让我们来看,举个例子来看。假设A商家都只卖电冰箱和手电筒。A商家卖了900台好评,其中有100个有好评,手电筒卖了100个,有100个好评,所以它中好评率是多少?20%。B商家卖了100个冰箱,没有一个好评的,卖了900个手电筒,还有100个说不好。你看了这个数据只有,你还会找B买东西吗?有了这个数据之后,怎么用这个数据,对我们要求还是比较多的,要懂这些统计,要深入分析我们到底需要什么?业务上的需求是什么?我们感兴趣的核心数据是什么?而不是随便拿一个数据过来忽悠。

    美国竞选民意调查,每次竞选都有很多民意调查,还有一些州的首脑竞选。1936年的时候,Roosevelt总统和AlfLandon竞选,最后有一个民调公司做了一个民调。怎么做的?它向上千名拥有电话的人寄出了明信片,然后有230万人回应说我选Landon。结果民调公司一看,这么多人回复,抽样样本这么大,就说罗斯福当选不了,结果就是罗斯福当选了。为什么?因为当时拥有电话的人都是比较有钱的人,他多半是共和党。所以这个采样,就是有偏的采样。
    2012年Abama和Romney的竞选,一开始大家觉得Abama不错,后来第一轮总统辩论之后大家觉得Abama太烂了,所以又有很多人说Romney赢。因为很多民调公司发现第一次演讲之后,Romney的支持率大大上升。但是实际上有一家民调公司说不是,他的依据就是,在变论前后都做了民意调查,其中有70%都是参加了这两次民意调查,这70%的人立场几乎没变,还是Abama领先。为什么其他民调公司会以为Romney赢呢?因为第一次民调之后,Romney表现得那么好,以前不想投票的那些人纷纷要来投票,所以参与率比较高,所以样本已经变化了。
    还Bradley effect,这是洛杉矶的黑人市长,他竞选加州州长的时候,民调一路领先,后来没有当选。为什么?因为当人家去问选民说你要投谁呀?选民说我要不投黑人,是不是会怀疑我有种族歧视,所以说投黑人,结果真正投的时候又不投。
    所以先要获取“正确”的决策数据,首先目标要非常明确,你要知道你要什么。比如说选商铺,我们给出来的数据是商铺的总好评率,但这个总好评率并不等于它每一个商品的好评率会高,对吧?美国民调也是这样的,它样本的选取,背后隐含的假设是说我选的这些样本是有代表性的我,我的选民邀请是完全随机,选民接受民调的比率,两党的选民都是类似的,而且选民在说实话,这就是它隐含的假设。所以我们分析的时候首要要看你想要什么,我们的目标是什么?还有我们收集的数据,数据本身是什么?我们本身有没有隐含一些假设,这些假设是否是满足的?

    我们看一下这个例子,这实际上是ebay真实做过的一个测试,页面有两种布局,我们是每行显示三个商品,图片小一点还是每行少显示一些,图片大一点。这两种设计公说公有理,婆说婆有理。最简单的方法,说我先用你小的图片,过两天再用大图片,对比一下购买率、点击率有没有上升?这是一种方法,但是是行不通的。比如说这两天我把你大图片放上去了,马上过周末了,我们做电商的都知道,周末跟平时很不一样的,你看到周末数据升高,是不是大图片好呢?不知道。所以在统计里面做这种决策的话,最重要的是一个随机对比测试。随机对比测试很简单,在统计里面,在大数据里面都是一样的。所谓随机对比测试,就是需要把新的算法做成一个新的系统,然后跟旧系统同时上线,数据上来的时候随即把它分到两个系统中去,最后比较出来的各种数据,看看有没有某一个系统里面各项指标是明显比另外一个高的,这就是随机对比测试。在电商里面做随机对比测试,其实有很多需要考虑的东西。比如说我要关注的指标是什么?是不是多少人浏览?这是一种。是不是点击率呢?是不是点击前耗损?就是说用户在点击之前看了多久页面才做了点击,这意味着是不是我们的页面战时是不是对的?还有展示的商品是不是对的?是不是符合预期的?还有成交率、成交额,实际上每个系统都不一样,有优缺点。比如说你实际上要看点击率,实际上ebay我们做了一个算法,在每一个查询上做的错误,导致这个用户一搜出来,他实际上是要搜集一个普通的东西,结果出来一堆女生的泳装,那点击率可高了。所以你如果要看点击率,就会觉得这是对的,但是实际上不是。

    看成交率行不行呢?我们曾经把我们搜集引擎修改了一下,造成的结果价格比较低的东西,它更倾向于排在最前面,这当然不是我们的意愿,但是出来结果是这样的,结果发现商品成交数很快很升。你们知道ebay的商业模式跟天猫很像,就是成交之后抽成。结果买了很多很便宜的东西,商品数量上去了,但是实际上ebay的赚到的钱下降了。你到底是考虑提高商品成交的数目还是让你公司多赚钱,也是需要考虑的。
    还有成交满意率,你不管商品质量怎么样,只要看起来很漂亮的,不管是不是假货都往上推,只管成交量,不管评价,可能满意率就下降了。
    还有测试对象怎么去随机筛选,也是需要考虑的。还有测试结果的误差分析和P值计算。你到底是变成几天,出来的结果怎么证明说B系统比A系统好?统计上是显著的,不是因为一些随机的误差。还有你做测试的时候还要考虑周期性、季节性,电商里面季节性是非常明显的,周末和非周末,购货的旺季和非旺季,就像年底,买的东西肯定就不一样。我就发现我们当时做的一些测试,在平时我发现我们新算法是算好的,但是到了圣诞节这段时间,就发现新算法反而不好,所以电商里面季节性、周期性是要好好考虑的。

    还有多模块之间的干扰,举个例子来说,我们做搜索引擎的时候,用户做输入关健词,我们就会做查询分析。比如说你搜移动电话,我们知道移动电话和手机是同义词,所以我就把移动电话和手机的结果都显示出来了。比如说你搜索苹果,一开始没有苹果手机,你搜索“苹果”,我只把水果反馈给你。后来又了苹果手机,我就又把苹果手机也加进来了。但是因为背后的排序系统是基于很多指标的,比如说你商品的点击率、购买率怎么样,会加上去。这就导致我虽然把苹果手机和苹果水果都都反馈回来了,但是这个排序的算法里面,它还会把以前就会出来的商品排得更高,以至于新返回回来的苹果手机排在很后面。所以你说这个查询扩展效果是好还是不好?这就有一个模块干扰效应。比如说我做了一个搜索引擎,我觉得经过手机比较好卖,我就把跟手机有关的搜索引擎,把苹果的排序高一些。可是正好我们的广告位正好都是苹果手机,用户一搜索一看,广告位上都是很漂亮的图片,苹果手机。他直接点了广告位了,那这是不是说明你这个排序算法不好呢?如果过一段时间,广告位又被三星手机了,这时候排序算法你多返回苹果手机可能又有用了。
    花很多时间讲随机对比测试,因为这真的是太重要了。在统计界,一般觉得随机对比有几个限制,一个是客观限制。比如说你要测试说我要送宇航员去月球。是派三个宇航员呢还是四个呢?派三个是两男一女还是两女一男呢还是统一性别呢?你要做测试的时候是不可能的,总不可能多发射几次试试吧。还有伦理的限制,要证明抽烟有害健康,这其实很不好测试。比如说我做随机对比测试,选了100万个青少年,50万不允许抽烟,50万让他们天天抽烟,几十年之后看看患肺癌情况有没有不同?这是违反伦理道德的。这两个可能对我们这边没有什么影响,但是第三个情感限制对我们是有启示的。  亚马逊曾经做过测试,它有了新的算法,说我怎么给我的商品定价,结果它就拿去做AB测试了。结果有用户在自己的电脑上买了东西,结果到他朋友的电脑上去看,价格低了5块钱,他就很恼火,说你们亚马逊是不是经常这么骗我的钱。当时这个事情闹得很大,最后他们CEO亲自出来说,这是我们在定价策略上做的一个测试,并没有试图去讹你们的钱,只是一个测试,以后我们再也不这么干了。美国大陆海空公司他也做过测试,比如说飞机晚点,他要给旅客道歉。他要把需要道歉的旅客随机分为三类,一类给旅客发道歉信,一类既给道歉信又发补偿金,还有一类就根本不理他,随他去吧。这样他们实际上做成功了,最后发现赔偿金加道歉书的一类人,接下来的时间在航空公司消费大大增加,总的来说一年可以多赚一两亿。这个虽然是成功了,但是非常凶险,如果万一几个客户都在一组,他们一比较,发现你跟他道歉,给他发钱,不给我道歉,是很有风险的。所以我们需要慎重,一方面技术上需要慎重,另外一方面就是在决策、情感上面慎重。

    总结一下大数据思维,大数据思维实际上都是虚的概念,我这里也是虚的。

    首先我觉得要重视数据,让数据说话。首先是要收集数据,现在大数据架构能够帮助你收集各种各样的数据,而且能够很快地把数据收集出来让你使用。接下来就是要让“正确”的数据说话,基于业务,明确优化的目标,代表性的样本或者全体数据,随即对比测试数据。现在大家都说数据科学家,我觉得数据科学家有一个很重要的数据是很重要的,就是对业务的理解。马化腾也说,我现在不担心其他的公司,但是我担心不知道90后在想什么,他不懂业务,就不知道业务应该怎么定位。我的朋友也说的现在的90后和00后不可理解了,他说有一天在小区里面忽然有个小姑娘冲出来抱住我的腿说叔叔你娶了我吧,后面***妈走出来说,你今天就结婚也得去上学,00后的思维很难捕捉。我同学说他继续往前走,去学校找他新认识的女朋友。结果在校门口有一个小男孩说,给你一百块钱,你一定要帮我出席一下我的家长会。没办法,就帮他去。结果一进教室门马上跪下说,老婆你一定要相信我,这不是我的孩子。原来小朋友的班主任就是他的女朋友。
    所以要让正确的数据说明,所以我们要基于业务明确优化目标。然后选择样板,样板是要有代表性的或者是全体数据。还有,我们要合适的利用随机对比测试。其实都是统计里的东西,大数据相比统计有更多的范畴,或者说有很多地方还是不一样的。比如说统计里面特别关注的是数据的质量如何?有多少误差、多少噪音?大数据可能对这一块有其他的办法去解决它,所谓混杂性,在大数据里面就没有那么重要。以前我们思考问题的时候,一般都会讲因果性。可能在大数据时代,我们可能更多要关注的是相关性。
    看个例子,在一般网上我们都会做拼写纠正或者同义词挖掘,怎么做?一上来我们就通过自然语的规则,通过语义来找同义词,这样想就完蛋了,因为互联网很多不是基于自然语义的词。比如说Ipone,并不是什么词,而是别人推出来的商品,而且要耗费大量的人力,没准哪天就又变了。拼写纠正,商品推荐,这都需要有相关性。当然有其他因素,一个最主要的因素,我在同一个会话里面,看这个同一个词出现的概率有多高?比如说Ipone,后面的“e”掉了,搜集这个,因为用我这个网站的人太多太多了,用这个的也很多,因为很多人犯同样的错误,我把样本拿出来看,很多人发现这个错误,所以又改过来了,所以你看他们的会话的时候,第一个查询是少个“e而”的,第二个是把它补正确的。而且第一个查询没有点击,第二个查询之后就有点击,或者马上换了词查询。所以在大数据时代会给我们很多非常准确还有有联系的信息,都有相关性。有很多搜索词都是很相关的,如果真的很关联的话,你把数据拿出来看,大数据一看,真正相关的关健词真的是很大范围上在同一个会话里面出现,所以所有东西都可以通过会话的相关性来解决。
    包括推荐引擎基本原理也一样,如果两个商品,真的有内在联系的,当然你可以雇一帮专家,去给你建字典、建这个树,没问题,是可以做,但是没有拓展性,而且耗费人力。其实搜索引擎也是看业务的相关性,如果两个商品真的很相关,有内在联系,大数据拿出来一看,相关的商品经常被同一个用户所购买。你发现这个规律,如果这个用户只买了一个商品,你就可以推荐另外一个商品,这是推荐的基本原理。
    有很多很多大数据挖掘的案例,包括搜索商品的搜索算法,我们当然可以做很简单的搜索,比如说按价格排序,按上架时间排序,按很多方法,按商家的满意度排序,都可以排。这都是单一的排序,不能满足我们的需求,而且很容易被被商家所利用。比如说ebay,按上架时间或者按结束时间排序,那很多商家明明只有一个商品在卖,但是给你24小时重复上载到几十次,人家一搜索的话,他商品就出现了。你可以要有一个好的算法,你要考虑去猜测客户的意图,你可以建立很多很多规则,比如说“城市多金男”喜欢什么样的东西,会有什么追求,可以建立这样的规则。但是我不说大家也知道这里面有很多问题。

    现在搜索引擎怎么做?我已经做过核心算法,我就把跟搜索引擎有关的数据一个一个弄出来。比如说对我们电商的排序系统,涉及到几个大类的信息,有几个用户本身的信息,他的背景是什么?曾经购买过什么样的商品?购买商品的类型是什么?商品本身的信息,商量的质量如何、价格如何?图片好不好看?背后的商家如何?历史的点击如何?诸如此类的,你把这个数据拿出来,就会形成很多的举证。我现在再把历史的成交数据拿出来,看看哪些是真正成交了的,哪些是没有成交的。这样我们就形成了一个精确的举证,然后每一个背后还有一个分析,说这个是真实成交的,零就是非成交的,就有这种样本,然后就把这个数据推给机器学习的算法,给你一个预测的值。预测出来,你会发现,可能之前想象一点都没有用,但是可能它很有用。比如说ebay之前做的测算,商品图片的大小,对商品销售就很有影响,你之前根本想不到。它出来的结果可能没有因果性,你也没法去解释,没关系,在大数据里,你只要找出相关性就可以了。
    我们都知道,如果我们知道一个人已经怀孕了,她要生宝宝了,这种客户实际上是很好的客户,因为她生宝宝之后就要买很多很多东西,这是美国各大商家试图在争取的用户。他做了一个预产期的预测,预测之后,他就给客户发广告,说商品打折。结果他给一个17岁的女孩发了,他老爸发现了就很生气,就冲到他们本地的店,说怎么回事,你们是鼓励未成年人怀孕吗?结果几周后他又跑来说,真对不起,我女儿真的怀孕了。如果要预测预产期?怎么办?只能找这种相关性。他就发现我们历史当中已经知道她怀孕的,她买了很多尿布,在她买了很多尿布之前,比如说很多人在怀孕的前七八个月,买那种没有香味的护肤乳液,或者说有很多东西就不买了。通过相关商品预测某个女人是不是怀孕了,而且是多久以前怀的孕,多久之后生宝宝,他就会定向投放。当然他也学乖了,之前是广告赤裸裸地邮寄给你,后来就把很多广告放在一起发,把小孩的广告放在中间,显得好象漫不经心。
    像刚才举的例子里面可以分为两类,一类是对已有的产品的改造,比如说搜索引擎找就有了,推荐算法找就有了。在大数据时代,你可以通过大数据提高已有算法的。还有一类,对于很有大数据思维的人,他可能就想利用大数据一些新的手段、新的思维。比如说Farecast和Decide,都是同一个教授做的,是华盛顿大学的教授。他在2007、08年开始做Farecast,预测机票价格,他就告诉你你要去夏威夷玩,是十个月之前买票还是之后买票便宜,就做这个东西,这个东西2009年被微软重金收购。然后教授马上又想,我预测了这个,我能不能预测这个商品的价格,他一开始主要专注于电子产品的价格预测。预测价格,又被ebay收购了。所以有这个思维的人,有了这样大数据,我怎么去产生一个新的产品,产生一个新的应用,这个应用满足用户的某种需求。我觉得这对于大数据时代是最需要、最难的,怎么去海阔天空地想这些东西。
    大数据的应用层次,这里简单说一下,最基础的层次,就是说我要把大数据采集下来,要整理要管理。比如说以前我是不可能把用户的采购历史整理下来的,是不可能把用户的资料翻出来的,大数据时代就可以了。ebay就可以了,你用ebay的话以往就只能查询最近一段时间的购买记录,现在可以了,你可以把历史购买数据和最近数据调出来,就可以做一些个性化的数据分析。这是所有数据操作的基础,之上就有数据报表和商业分析,以前可能没法说很快产生一个数据报表,而且是用很多很多数据来呈现,可能就很难做到。现在像ebay要做报表的话,上面领导分析做一个报表,就问他你要用一个月一年不还是几年呢,说是一年的,那几小时候给你,如果是一个月的话,我几分钟就可以给你,用全体数据,出来结果很快,也是大数据帮助我们做到的。第三个层次是所谓的数据科学,数据科学重视的更多是怎么去建模,怎么去预测。我想这就是三个层次,一个是基本的管理,一个是简单的分析,最后一个是数据科学家。
    我们来看一个过程,想象一下,现在有一个购买者来到某宝网站,要购买东西,他在用户浏览器里敲入网址,回车,后面会发生什么问题呢?哪些事情跟大数据有关呢?这也是我们之前负责搜索科学家招聘的时候喜欢问的一个问题。我们考虑一下,首先用户打入网址之后,网址就递交到DNS,DNS会把IP地址反馈给你。大数据时代DNS可能是在不同地方的,会把不同的IP地址反馈出客户不同的地理位置到数据中心。到了数据中心之后,会把数据做一个分流,这样做到第一步的分流,把流量分到不同的服务中心。到了服务中心之后,现在用大数据的底层架构,把数据的基本信息和历史信息都给掏出来,掏出来之后给它产生个性化的首页。个性化之后,用户搜索框输入东西,比如说那样输入了几个数据或者汉字,我们给他一个输入帮助系统,不需要输入全部,效率就提高了。还有拼写纠错系统也一样,还有查询理解,猜测用户意图进行扩展。比如说前面说了,人家输入了移动电话,手机也是移动电话,返回里面不光有移动电话商品,还有手机的商品,做了查询扩展的理解。系统根据这些扩展的查询,把商品拿回来了,拿回来之后做排序,你要进一步猜测用户最想要什么东西,他是想要手机,因为他输入了手机。我要猜测这个用户喜欢什么样的手机,你就要根据个性化和商品属性排序,就用我们前面说过的相关性利用机器学习的模型做排序,这里面还有个性化或者差评交易预防,它就可以预测说如果这个用户买了这个商品,最后给差评的科学家有多少?这都有模型,最后放到总的搜索排序的模型下面来用。
    页面一打开,你会发现搜索框里有相关搜索,还有商品推荐,右面页面最流行什么东西,给你显示出来,还有广告的显示,用户输入什么,我就显示什么广告,这都是个性化。还有相关导购的信息,最后我们有很多导购的文本,我们应该在什么时候应该给用户?比如说我输入电冰箱,导购网站,比如说一淘有很多电冰箱相关的内容,你就把这种文本性的东西也可以显示出来。
    这些用黄色字体都是大数据挖掘代表的,还有用户点击商品之后,还有商品情况的获取,很快,还有商品推荐。这就是一个简单的流程。
    最后简单说一下大数据时代的电商趋势。现在电商趋势我认为有很多维,比如说移动化、还有导购化,比如现在一淘也做导购,因为现在网上的商品太多了,没发选,所以你要教育用户,这就是导购化。还有国际化,像ebay我离开之前,做一个项目是要支持国际购买,比如说俄罗斯人购买东西,我不光把俄罗斯的东西返回给你,还要把这些英文翻译成俄罗斯文返回给你。还有垂直化,现在几大巨头垄断了,我的小的电商怎么生存?或者大电商里面某一个部门怎么提高业绩?这里就有一个垂直化,我们要根据这个领域好好把这个事情做好。在国外有很多做垂直领域的电商,现在其实都做得不错。我觉得最重要的趋势都是O2O,因为现在互联网这么发达,还有各种各样的传感器、智能家居,还有智慧城市等等各种各样的东西,会导致购物的意向会在随时随地出现,并且随时都能够满足,这里面就涉及到O2O。O2O里面就涉及到两方面,一方面是商品的购买,一方面是服务的购买。服务购买就跟本地生活很向卷,这也是O2O的一部分,最早是做团购,现在更多是做一些服务。O2O里面还有最重要的一部分内容,我猜想是社区电商。因为社区是中国最有特色的东西,美国没有这种社区。一进一个大门,几千户几万人住在一个社区里面。社区电商,以及社区电商之外怎么样去叠加其他业态。比如我做了一个社区服务或者社区的销售点,你怎么考虑怎么在线线下的融合。比如说我开了一家店在小区门口,除了卖东西还可以帮你代交水电费和其他业务,我觉得社区电商肯定是很重要的趋势。我们也在做一个项目,因为你在做O2O的时候,就必然涉及到线上部分和线下的部分。线上部分,我可以随时知道我线上店的运营情况,你现在就做不到,你离线在线O2O融合,你怎么融合?你怎么在商业模式上融合,怎么在数据上融合?我做的一个项目可以帮你把离线店做成在线店一样,你今天来了多少用户,老年人有多少?怀孕的用户有多少?我们看了什么?看完这个是不是也喜欢看那个?转化率多少?进店率多少?等等等等。在线店应该有的东西,离线店也应该有,在这样基础之上,我们就可以真正做在线和离线的融合,在业务上,在数据上都能够融合。

数据分析咨询请扫描二维码

客服在线
立即咨询