京公网安备 11010802034615号
经营许可证编号:京B2-20210330
谈谈人工智能、大数据和物联网
到2045 年,保守估计将会有超过 1 千亿台设备连接在互联网上。从移动设备到工业探测器、汽车、家电等,它们所创造和分享的数据,将给我们的工作与生活带来一场新的信息革命。哪些领域已经有了大量结构化的数据,且正在开始快速地联网,让人工智能有了用武之地?以共享单车为例,哪些东西上可以加上太阳能电池并用上 GPS 功能?哪些传感器、芯片能够继续迭代,它们将如何创造出新的商业模式?本文就来探讨谈谈人工智能、大数据和物联网。
人工智能为何现在大热 ?
2016 年 AlphaGo 横空出世,打败世界一流棋手李世石、柯洁。人工智能这个古老的、在过去三四十年里起起伏伏的概念,从教授们的游戏变成产业界的宠儿,也成为过去一年最热的创业领域。
从我的理解抽象来看,人工智能其实是一个更好的数据处理以及利用数据来建立模型的技术手段。既然它是一个数据处理的技术手段,在这个基础上,我们可以问两个问题:为什么它在今天开始热了?它能解决什么问题?
人工智能大热的一个前提是,过去 20 年互联网的高速发展,产生了大量需要被人工智能处理和加工提炼的数据。
今天,全世界每天产生的数据可能是过去几个世纪之和。20 年前,我们还用磁盘这类东西来储存数据,现在我们每个人的手机产生和传输的数据量都以 G 为单位计算。
是否拥有大量数据,并不断抢占数据的高地,已经成为衡量一家人工智能公司的核心。
数据从哪里来?
一方面,原来在线下已经结构化并且大量存在的数据,由于特定的原因或者历史进程而被大量数字化。也就是说,原来没有上网的数据现在上网了。这能部分解释为什么 SaaS、大数据和人工智能容易产生交叠。
过去半年,很吸引眼球的新闻是人工智能入侵华尔街。高盛这类金融巨头和一些大型对冲基金都在转向使用由人工智能驱动的系统,预测市场趋势,从而做出更好的交易决策。与此同时,交易员和对冲基金经理开始担心失去饭碗,因为技术变得越来越节省劳动力。
美国资本市场,即我们讲的二级市场,从 1980 年代有对冲基金,到 1990 年代中期有量化投资这个概念,用计算机做程序交易,它前台的交易系统、中台的数据服务、后台的基金管理和服务,整个链条已经完成了长期、完整的数据积累和数字化。换句话说,整个链条大概都已经完整地上线,并且经过了充分发展。
如今,在高速运算和海量数据的支持下,人工智能可以通过大量机器联网,把金融行业已经存在的数据搬到网上,制造出巨大的乘数效应。除了远优于人脑的数据分析处理能力,深度学习正在成为智能金融在未来的最大利器。也许在不远的将来,计算机能够聪明到预测我们的需要,并且引领人类进入富裕时代。
一个好奇:
在中国,有哪些行业、领域和正在出现的方向,像金融业一样,已经具有了大量结构化的数据,且正在开始快速地联网、流通,从而让人工智能有了用武之地?
大量数据的另一个来源是,过去 20 年里,原来没有被联网的传感器系统被联网,制造了大量的数据,并且上网流通。
我用几个最简单的小例子来解释这些新的数据来源。
今天的智能手机与20年前的通讯手机最大的差别,是里面装了几个特殊的东西——陀螺仪或者 GPS 芯片、品质更高的麦克风和摄像头。这些新增的传感器保持24小时在线,成就了我们今天看得到的许多商业模式,比如用语音替代文字、用麦克风来做输入的微信,利用 GPS 定位和地图创造出的网约车,基于摄像头的各类拍照和直播App,以及接下来我会分析的共享单车模式。
另一个例子是,亚马逊把一个麦克风阵列和在端上能够处理语音交互的东西放在一个音箱里,并且让它24小时在线,于是有了近两年大热的智能家居产品——2016年卖出了超过650万台的 Amazon Echo。用户和 Echo 的每一句交流(语音数据),都会被记录并上传到云端。
商业无人机领域的大疆则把规模更小、精度更好、相对能耗更低的陀螺仪、速度传感器、通讯芯片、高清摄像头和 GPS 系统,放到了原来没加传感器的飞行器中,而且让它们在线,并与手机联通。独特的视频、别出心裁的照片,都是无人机产出的数据。
这几个例子都导向一个结论:所谓核心部件或者是核心传感器的智能化和在线,能诞生新的商业模式。
共享单车的核心机会在哪?
在万物互联的过程中,我们看见了很多曾经难以想象的事情。一个有点特别的例子是共享单车。这大概是过去大半年许多人想不到的创业模式。
多年以来,自行车给人的印象都停留在七八十年代结婚三大件之一。但当它被安装上了传感器之后,在很短的时间内就攻占了地铁口,并作为一种短距离代步的方式,成为都市流行文化。
我们基金内部曾经带着疑问去了解共享单车的产业链,认为核心的 bug 就是那把扫码即开式电子智能锁——集GPS、电子控制和通讯芯片于一身。
锁上带 GPS,会导致一些问题。第一,对于摩拜、ofo 这类物联网设备,GPS 是硬件中最消耗电量的元器件之一,特别需要降低定位所需要的消耗。第二,两次骑行之间的时间间隔不能太长,否则电量消耗完了,就不能支持GPS在线和电子锁开锁。
共享单车公司们想尽各种办法,试图解决这些问题,可见这个问题的难处。办法包括成本不低的发电花鼓、夜间集中给电瓶供电、在车篮底部装一块太阳能电池板等等。
除此之外,共享单车对 GPS 定位传感器也有要求,在定位上即便相差20米,也就是楼前楼后的距离,找起来也会很费劲。
因此,一个非常低能耗又高精度的 GPS 定位传感器是共享单车这个商业模式本质上能运转得更好的前提。这个技术方案曾被许多人判为不存在。
共享单车有意思的点,在于在传感器没有演进得足够好的时候,这个模式就诞生了。不过,这个模式的风靡,反过来一定会刺激技术的进步。共享单车公司和华为、高通、北斗导航等公司联手研发物联网技术就是一个例证。
过去一年多,我们在全球各地见过一些从不同角度解决 GPS 的低能耗和高精度问题的技术团队,然后投资了一家叫睦星科技的初创公司。
这家公司的创始人化文生博士原来是斯坦福大学引力波探测器信号处理团队的核心成员。他的专业背景是广义相对论,这个专业的人一辈子只干两件事,证明爱因斯坦正确,或者证明爱因斯坦错误。
睦星科技利用团队在引力波探测上所积累的技术和经验,专注于提供低消耗、高精度、低成本并且在复杂环境中高度可靠的室内外定位解决方案。据我了解,它们能做到将 GPS 的能耗降低到现在的 1/50 到 1/70。这意味着,在一般情况下,只需要遥控器 1/2 大小的太阳能电池板就可以支持共享单车电池里的 GPS 持续工作。
我和睦星科技创始团队开玩笑说,你们的技术正当其时,因为共享电车当下最需要解决的问题就是低消耗的 GPS 定位传感器。
一个展望:
随着 GPS 技术的演进,未来哪些东西上可以加上太阳能电池并用上 GPS 功能?
万物互联何处去?
简单小结,伴随着大量线下数据的线上化以及新数据的产生,会诞生许多基于数据的商业模式创新。当数据大到一定程度,会对数据处理能力和效率有要求,这时,人工智能就能发挥作用。我们已经可以看见人工智能正在渗透并塑造许多行业。
因此,我们的投资逻辑是:
如果线下数据的线上化已经做得非常好,我们就投资大数据。
如果某个方向或领域中的大数据做得很好,我们倾向于投资这个方向或领域的人工智能。
如果一个行业还没有进入到大量数据产生的阶段,逻辑上我们就先投传感器,等传感器被很好地工业化之后再投大数据和人工智能。
以眼下的热门方向自动驾驶为例。鉴于很多底层技术尤其是硬件和传感器相关的技术发展还没有到位,自动驾驶还停留在研发和试用阶段,离建立真正的商业应用还差得很远。
今年 3 月,中兴通讯和美国政府达成和解,代价是交 8.9 亿美元的罚单,这几乎等同于中兴 2016 年将近一年的净利润。这件事情说明,中兴对美国一些技术的依赖使它始终存在技术风险和法律风险。往未来看 5 年或 10 年,决定许多行业发展的,都是底层关键技术。
回到当下的中国,对我们投资人和在人工智能方向上努力的创业者而言,更实际的问题是,当我们望向一个万物互联的未来时,要解决的是我们还差了哪些技术,以及如何能把这些技术的发展和应用留在中国。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16