京公网安备 11010802034615号
经营许可证编号:京B2-20210330
12.12中关村大数据日暨CDA数据数据分析人才培养分论坛演讲嘉宾——SenzC创始人 冯小平
演讲实录如下:
大家好,各位领导、各位专家数据分析师们下午好。
这是我个人的简历,我叫冯小平,之前做信息安全,做一些工程、搜索,后来去了一家NGO,也是做技术,现在我们做的产品叫做情境感知技术,在国内是第一家,在国际上也差不多是两三年,即使在硅谷也是。
我请问大家有没有看过这个美剧,中文叫《疑犯追踪》,强烈推荐,不光是它评分特别高,它讲的就是大数据时代的社会的情况。我喜欢它的几点,我认为它真的是现实板的Matrix,我觉得这是非常现实,甚至有可能在当下发生的大数据故事。大家都说有些集表现上来说已经在日常生活中发生了,有人成立了POI教。它基本的故事是有一个AI通过收集大量的数据来控制整个社会发展,比如谁竞选、社会往哪边发展的故事。
里面有一句话讲,对于AI来说,人类社会最大的一个弱点就是人跟人之间的关系。这个趋势不可避免,大家想不到,我们先把自己炼化下来,看我能分析出什么,这是我当时的一个很小的想法,之后我创业的时候也是它的本源和初心就是这样。
刚才曹老师说Hadoop是这个数据的关键,我认为这都是工程师造出一堆堆的工具,反而不是数据分析师应该掌握的核心技能,数据分析师应该是用工具帮助你越来越高层地访问到这些数据、操作这些数据,不用管底层数据怎么存储、怎么扩展,所以你以后拿到的数据会越来越高层,你不知道从哪拿到,你输入一句话就可以拿到这样的数据了,我觉得数据分析师应该更多地了解工业界对数据分析的需求,就像刚才说造面包,数据分析师需要知道人类需要造什么,这些人需要买什么,除了面包之外,是不是我还要买起司、蛋挞之类的。我第一个方向的就是多玩Gadget,大家看到京东智能的一些小玩意,我觉得这是数据分析师的玩具。
这是我平时会随身携带收集数据用的东西,包括Kinect大家都很熟悉,Kinect windows你可以用的系统,包括iBeacon都是写几个代码就可以拿到数据;EyeX是一个民用级别的眼动移,这两个MotoX是我平时都会带的,录音记录,还有Nexus7是每天带在包里,你可以搜周围的信息。

Kinect for windows
比如说Kinect windows,这个是我摆在客厅、办公室里说这里什么时候有一个人在这边,这个东西持续记下来了,我们现在还不知道能分析什么,一旦有一天我们的算法更牛了,就可以算出来东西了。但是如果算法牛了,你没有这些数据就完了。
iBeacon
这是iBeacon,这个东西造价很便宜,如果你想知道你跟哪个东西距离多远,你就可以把这个贴到那个里面,你的手机如果接近这个东西,你就可以持续知道我离它1米、我离它3米,它是可以记录很多数据,比如你跟你的书包一天接触多久,当然你也可以做室内定位,比如说你在这个屋子里哪个位置待了多久。
MYO
MYO是一个绑在你手臂的机器,你通过几个代码就可以知道每一天手臂肌肉的数据。
Mindwave
这个是一个记录脑波的数据,它可以简单地记录出你一天的注意力的值,当然可能学过大脑神经的人知道各种波对人的精神状态是什么作用,它又做了一层,你可以知道这个人注意力多高,你有没有眨眼,你有没有很冷静。这个东西可以用来干嘛呢,我们后面会讲到。
NarrativeClip
这个NarrativeClip,这个是我戴在胸前的,它每隔几秒会拍一张照片,大家可能会说会不会侵犯隐私,如果数据分析师考虑隐私的话就没法做了。这个想象空间非常大,比如说前两天就是一个人记录了6个月的数据可以分析出这个人每一分钟在干什么。当然我戴这个也戴了一年半了,硬盘都堆了几个硬盘的数据,我也就是分析分析我每天接触什么东西。最后我分析的结果是我一天40%的时间都在看消息,我那一天只有5%的时间视角里有人。
EyeX
EyeX这个是放在笔记本上就可以看屏幕的区域,你什么时候在看哪,基本上每秒钟几十赫兹。
刚才那些设备都是市面上能买到的,你从中能拿到的数据,如果你自己做是基本上你要花几年,甚至十几年才可以做出的东西,这些Gadget给我们带来的好处就是我们可以站在它的肩膀上拿到很高级的数据,做深度的数据。
另外分享多去hackathon,我认为hackathon是一个线下同性交友社区,当然不一定同性。在hackathon一般大家花两天周末的时间一块去琢磨出一个小点子,然后把这个点子用两天的时间,有程序员,有设计师,能够实现出来,并且给大家展示出来。
比如说之前我们参加hackathon的时候,像MYO可以检测电流,后面紫色的灯也是可以通过API访问的,我们通过摆手的动作改变灯的颜色,我边摆手边听歌这个灯就可以变颜色,这个就是hackathon做的东西。
另外一个hackathon就是我们做了一个人到哪个屏幕旁边,内容就显示在那个屏幕旁边的一个简单的模式。我录了我写代码时候的脑波的情况,我注意力的值,我可以拿我注意力的值来评估我不同区域代码出BUG的几率,概率低的我就可以过去,高概率的地方我就仔细检查一下。
第三个分享就是多用API。
Mashup这个概念很早就提出来了,大家认为以后各种的技术都是堆占型的,大家都要基于别人的API做出自己的产品,其实现在已经这样了,你创业服务器肯定不用自己的,都用阿里云,都不用搭自己的后端服务,图象识别有,声音识别有迅飞,都有各种各样的服务。当时有一段时间很疏于技术,我花三十天时间去接触一些API,这些API都是我搜的最新的美国的创业项目他在用什么样的API做。
比如爬虫、图象识别、情绪识别,像刚才说的物体的其实都有在线的独立第三方提供API,如果你不知道这些API的话,你需要想我需要这样一个功能来实现我的想法的时候,你就不知道到底应该怎么做,难道图象识别、人脸识别我要重新做吗?那不可能的,去了解这些可以帮助你的API能够提升你效率和开拓眼界。我不知道大家在这里面能看到几个眼熟的东西。
最后一个分享就是多开脑洞。
因为记忆、情绪,大家现在越来越多地被证明是可以被机器替代的。我们就想到底人有什么可以不被机器替代的。谷歌有一个人说2020年可以实现人脑连入互联网,我觉得脑洞是人类残留的不可解的核心价值,我欢迎大家来我们私下组织的小团体搞了一个小节目,《说好的脑洞呢》,基于现在基础的技术,未来能够实现什么样很好的想法。比如说发光二维码,如果我们墓地放二维码,就可以看到死去的这些人的情况。这些都是脑洞,但是这些脑洞本身就代表着你思维的边界和你对现在技术的一些了解的体现。
精彩问答
我想问一下像这一类设备技术下一步会有哪些新的突破。
冯小平:这些设备肯定是越来越小型化,越来越接近人的穿戴,比如说脑波有人说拿脑波做环境的改善,比如说智能大厦会根据你身体的情况自动调节你所处的环境的温度、光照,更往前就是这些东西足够小型化,可以看到很多会越来越小,越来越让你感知不到它的存在,包括各种可穿戴设备也是这个趋势,就是不断地把你各种维度的数据以你舒适的方式收集下来,收集下来以后,就是他们怎么卖钱的问题了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26