京公网安备 11010802034615号
经营许可证编号:京B2-20210330
传统领域是大数据创业蓝海
穿着拖鞋,牛仔裤挽着裤腿,手拿老款诺基亚直板手机,9月14日,在城南一家白领穿梭的高档商务写字楼,国内大数据行业领军人物——电子科技大学“80后”教授周涛走进了记者的视线。
“大数据时代已经来到我们身边,并没有那么多的云遮雾绕,而是相当接地气。”短短一个小时,周涛用身边的例子和最直白的表述,拨开大数据的神秘面纱,描述了一个可触摸的数字化时代。
专家简介
周涛,1982年4月出生于成都。2005年获中国科学技术大学学士学位,2010年获瑞士弗里堡大学物理系哲学博士学位。现任电子科技大学大数据研究中心主任,从事数据挖掘与复杂性科学研究。
26岁获教育部自然科学一等奖,27岁获聘电子科技大学正教授,29岁获中国青年科技奖,32岁入选Elsevier最具国际影响力中国科学家,33岁担任全国青联常委,科技界别副主任。
目前论文引用过万次,创立、联合创立和投资的大数据企业市值过百亿。
怎样理解大数据?
“一切都被记录,一切都被数字化。”
从硅谷到成都,大数据,这个新鲜的话题正全球同步热传。一场关乎每个人生活、工作和思维的大变革正在悄然发生。
到底什么是大数据?
周涛认为,“大数据”是“数据化”趋势下的必然产物。数据化的核心理念是:一切都被记录,一切都被数字化。“最近两年,数据量爆炸性剧增,几乎等同于2010年以前整个人类文明产生的数据量总和。”
浏览过的网页、去过的地方、吃过的东西、购买过的产品……不经意间,我们生活中的很多数据已经被记录。
这么多数据,有什么用?
周涛解释:“大数据要求数据能充分发挥其外部性,并通过与某些相关数据交叉融合,产生远大于简单加和的巨大价值。”比如,国家电网智能电表的数据可以用于估计房屋空置率,淘宝销售数据可以用来判断经济走势,微博上的关注关系和内容信息可以用于购物推荐和广告推送……
最近,周涛和他的团队正在做一件有意思的事情——寻找校园中最孤独的人。他们通过选课记录、食堂用餐刷卡等,从电子科大3万名在校生中,采集到了2亿多条学生行为数据。通过对不同ID卡“一前一后刷卡”的记录进行分析,可以发现一个学生在学校有多少亲密的朋友,比如恋人、闺蜜、死党。“我们寻找到了800多个最孤独的人。他们平均在校两年半时间,一个死党都没有,这是一件很可怕的事情。”周涛分析,数据表现出这些学生存在一定的社交障碍,这些人中17%的人可能产生心理疾病。由此,学校可以对这些学生更加关注,有针对性地帮助他们解决心理问题。
这项针对在校大学生行为的大数据研究,是教育部网络文化建设示范性项目中的亮点。在周涛看来,这样的行为数据研究还有广阔的应用市场,比如可以移植到高强度的劳动密集型行业中,关注广大产业工人的心理疾病问题。
如何利用好大数据?
“跨领域关联,才是大数据的精髓。”
近期,成都市设立全国第三个大数据管理局的消息,又一次提振了成都大数据产业发展的信心。“推动新兴产业发展,成都再一次走在了全国前列。”在周涛看来,大数据管理首先带来的改变,就是将实现全市政务数据的共融共通。目前,各部门都储备了大量既权威又高价值的数据,但却很难实现部门间的数据共享。现在通过大数据管理局的牵头,就能实现政府部门权威数据的高效管理和资源共享。
借助大数据,企业和政府管理人员的决策,也将从“经验即决策”过渡到“数据辅助决策”,最后实现“数据即决策”;教育培训、零售业和医疗服务等行业,也有望实现对服务对象的数字化和个性化定量服务。“分割的数据价值有限,只有实现数据的流动才能最大化数据价值。”周涛认为,这个观点也同样适用于当前电子商务的发展。“数据的关联形态正在发生变化,一名用户既在微信上,也在微博上,同时还有线下医保、社保等数据,以及交通出行数据。要了解一名用户,这些数据都需要关联起来进行处理。”
周涛提出,大数据的本质不在于数据量有多少,也不在于是否是异构的数据,而是在于数据是关联的,整体的数据可以流动起来。“跨领域关联,通过一加一产生远大于二的价值,才是大数据的精髓。”
大数据时代如何看待隐私问题?
政府和业界都要担责
每一次敲击键盘,每一次点击鼠标,每一次网上交易……在周涛的视野中,互联网生活中每一个习以为常的输入,都可能成为大数据企业的“原材料”。企业就可以利用其中的信息,分析消费者的行为,从而为消费者提供个性化、量身定做的服务。但不可避免的,这也会带来个人权利与自由遭到侵犯的隐忧。
实际上,自从有了互联网,保护隐私就成为一个问题,但是以前泄露的方式和途径比较零散,而大数据的技术和理念,使得企业和政府有可能以前所未有的力度掌握我们个人的信息,拼出一个人的全景信息。“大数据背景下,普通人基本没有能力去保护自己的个人隐私。”在周涛看来,科学和商业进步,都会是一把“双刃剑”,数字化生活中的隐私保护,个人的应对能力会显得渺小。“要真正融入大数据时代,享受个性化专属信息服务,就不得不牺牲一部分个人隐私。”周涛直言不讳,“付出巨大努力,放弃很多有意义的服务,尝试保护自己,往往是得不偿失。”
当然,政府和业界需要扛起担子,肩负起保护隐私的责任。周涛表示,政府应当设计出非常苛刻严格的法律条例和行业规则,这对大数据产业本身也是一种保护。针对那些非法利用个人隐私来收获不正当利益的企业,“职能部门必须下重手,要一棒打死。”
对能够处理隐私数据的企业,周涛建议必须尽快制定出准入机制。“我们现在正讨论一个方案,对隐私分等级。”企业如果需要处理某一个层级个人隐私数据,就必须要具备苛刻的准入资质,如企业的软件防火墙、硬件防火墙需要通过安全评测中心的评测,确保不被攻破而造成隐私数据的泄露。
大数据企业如何创业?
“从市场痛点入手,做一把杀牛的好刀。”
“80后”最年轻教授、电子科大博导、最具国际影响力科学家……走出一连串学术光环,周涛还是创业场上的实战派。
2009年联合创立的大数据科技公司,目前市值超过30亿元;2013年他出资1.2万元参与创立的一家注册资本仅3万元的公司,当下个人所持股份市值已超过3亿元。目前,周涛创立、联合创立和投资的20余家大数据企业,市值总和超过百亿。“创业的风险比较高,但也是一件令人兴奋的事情。”周涛认为,大数据创业,需要集中精力做好五方面功课:找准市场的痛点、具备有优势门槛的核心技术、组建一支专业管理团队、找到优质的数据合作方、选择一家懂自己的基金。
周涛认为,大数据创业首先需要从市场的痛处着手,找准市场的核心需求。如果只有技术,并没有寻找到匹配的市场,手中拿着刀去再找牛,这样的创业一般会失败。“如果现在大家都等着杀牛,就可以考虑如何去做一把好刀。”
8月底,周涛在成都参与创始的一家大数据科技公司,完成了1亿元人民币B轮融资。借助基金之手,短短两年时间,公司规模从3万元裂变成10亿元。“一定找到一个懂自己的基金。”在周涛看来,大数据是不能实现快速盈利的行业,很多创业公司会出现长时间的亏损局面,“你的投行不应在财报上有过多的要求,而是要一直支撑公司把技术做得更好更棒。”
成都的大数据创业环境如何?周涛认为,从全国范围比较来看,成都目前具备很好的大数据创业氛围,已有多家有业界影响的公司聚集。但比起北京、上海、杭州、深圳等地区,成都还有一定差距,主要表现在专业的顶级投资机构少,顶尖的技术、运营、市场和金融人才缺乏两个方面。
目前,国内大数据的发展多集中在泡沫较多的垂直应用领域,周涛认为,大数据未来创业的蓝海,应该集中在目前较少关注的传统领域,如医疗卫生、食品安全、工业制造、农业养殖等领域,创业者可以更多地关注具有颠覆性的硬技术创新,以及大数据在传统行业的巨大价值。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22