京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一个技术创业者的大数据蓝图
究竟只是高大上地在做大数据概念的传播,还是在做一些落地的更具体的实事?这可能决定了一家大数据公司能否站住脚。”张宇说。他坚信,还是应该沉下心来做事才可能成功
律己足以服人,轻财足以聚人,身先足以率人,量宽足以得人。”这是博晓通科技公司联合创始人兼CEO张宇在朋友圈写下的心得。身为一家技术和草根创业公司的创始人和CEO,张宇凭借着这样的信条,从零开始,即使身处最艰难时期,公司仅剩下3人的境地,仍然不忘初心,与创业伙伴将一家小公司用5年多时间打造成颇具实力的大数据分析平台和服务提供商。
埋头打造平台
1996年张宇考入山东大学,作为计算机爱好者,参与筹备和管理了校内的首个互联网实验室。2000年毕业后,张宇任职于华硕集团上海公司,这是这家以硬件和笔记本制造知名的厂商进军中国的前站,经历了新公司创立过程中从无到有的过程。在人力资源最不足的时候,不仅白天需要参与业务拓展,晚上还带领团队完成了生产线铺设和验收,为了节省时间,连续几周直接睡在空荡荡的厂房里。2001年出国读研,2002年获英国布里斯托大学理学硕士学位,并加入英国本土的一家互联网电商公司工作。2003年底回国后,张宇加入了联想电脑,正好是处于联想巩固中国市场龙头地位,收购IBM个人PC业务并进军海外的期间,亲身经历了国际化的阵痛和不同管理思维和企业文化碰撞的洗礼。后于2006年加入维思比科技,任大客户销售、产品管理、运营管理等职务。无论是兼职的学生时代,还是职业经理人的几年,张宇都是在一个动荡变化的氛围中因持续创新而痛并快乐着。
几年前,随着当时以微博为代表的社交媒体的日益活跃,电商渠道在品牌分销和消费者购物中的重要性日趋明显,张宇预感到企业外部数据分析的价值会越来越大。2011年,张宇与4个朋友自筹资金联合创立了博晓通科技公司,开始便致力于打造一个SaaS模式的社交和电商数据分析平台。
“企业都已经认识到数据很重要,都希望做自己的数据分析。但是这个成本不是每个企业都能接受的。而数据分析对于改善企业运营的价值不可忽视。”张宇说。通过增值服务、SaaS分析工具和API数据结果共享,博晓通为客户或者合作伙伴提供大数据分析能力,即作为社交和电商大数据枢纽做基础性工作,同时也解决用户的具体业务需求。自2013年第一代平台上线,它即开始服务于西门子、博世西门子家电、英特尔等世界500强企业和国内外知名的研究机构。
多年来,作为专业的大数据应用提供商,博晓通在家电、旅游、服装、汽车等行业积累了丰富的数据及行业经验。张宇告诉记者,以汽车行业为例,博晓通多年来积累并时时采集该行业各个方面的数据,从市场上品牌、在售车型、价格、用户使用评价、用户偏好、价格带与配置、采购决策因素等等从横向到纵向的信息采集和多维分析,帮助用户和合作伙伴使用其平台非常方便、灵活地洞察市场变化。
在这个迅速变化的时代,社交媒体逐渐取代了传统媒体成为信息流通的主要渠道,社交媒体平台用户既是内容的产生者,也是传播者。在内容产生、发布和扩散的过程中,相关的数据有丰富的内容价值帮人们从未知状态走向了解,也有描述个体行为特点的数据价值。为此,博晓通利用大数据帮助企业衡量品牌的传播ROI和影响力,识别用户的负面反馈来进行舆情管理支持,避免危机;形成不同行业的数据产品来参与企业的运营决策,帮助企业提高效率和降低风险。
经过5年的大数据领域的技术积累,模式探索和实践检验,博晓通如今已经成为成熟的大数据分析平台和服务提供商。通过协议合作、数据交换和技术采集,它扮演了大数据生态链中数据分销商、增值服务提供商的角色;博晓通为用户聚集和管理了分散的企业外部数据,不仅帮助用户解决数据缺失的困难,而且可以建立持续有效的数据资产。
脚踏实地向未来
随着大数据概念热度不断增加,大数据公司越来越多。在张宇来看,大数据对行业的结合很重要。“究竟只是高大上地在做大数据概念的传播,还是在做一些落地的更具体的实事?这可能决定了一家大数据公司能否站住脚。”张宇说。他坚信,还是应该沉下心来做事才可能成功。
虽然大数据在国内仍是舆论热点,但张宇指出,从Gartner的最新技术生命周期曲线研究中,已经不再单独列出大数据。这是因为,作为一种基本的发展趋势,大数据及相关技术已经融入到很多的业务场景,而新兴的机器学习,人工智能都和过去几年的大数据技术存在承继的关系,是大数据资源的价值催化剂,成为该技术曲线的新内容。
在张宇看来,大数据应用的4个成功要素:目标、数据、分析(模型)、计算,缺一不可。“对于博晓通内部而言,评价一个产品好与坏的标准就是,它是否解决问题。”现在常见的一些应用问题是客户受到大数据理念的影响要上大数据项目,这种重视数据的现象是好的,但目标过大或者过空洞会影响到短期内大数据应用的成功可能。
更值得注意的是,大数据正在政务领域扮演着越来越重要的角色。张宇认为,博晓通在政务领域所做的大数据分析已经不再是简单的舆情监测等,还有更多更有价值的应有场景。比如基于海量招聘信息和求职者的公开大数据对失业、就业情况的分析。比如博晓通正在努力将以色列、德国、美国等国外投资机构、科技类媒体投资的金额及资金流向进行识别。这些资金究竟是投资在生命科技领域?还是人工智能?“通过这样的数字经济图谱的描述,希望对国内的投资机构以及政府产业基金和政策引导等带来参考意义。”张宇表示。
科技界重量级人物Andrew Ng(吴恩达)曾经把深度学习比喻成一个火箭。神经网络是火箭的引擎,大数据构成了整个火箭另外的重要组成部分——燃料。张宇认为,大数据资产和深度学习的结合会创造新亮点。“以往我们谈大数据的时候,更多是强调存储和管理数据的能力,局限于对于以往历史数据的统计、汇总。未来考虑到神经网络和大数据结合,我们就可以发挥大数据真正的价值。”张宇说。
以博晓通所处的领域为例,张宇描绘了这样的规划:比如通过流行图像和社交数据的分析,为消费者分析流行趋势,根据消费者购买能力,推荐不同价位的相似款式但不同品牌的时装产品,满足不同阶层消费者追求美的欲望,并且合理支出。比如根据不同旅游目的地的评价和目的地的最新动态信息,通过用户的交互选择,为用户评估旅行社的产品竞争力是否最佳,推荐合适的旅游产品或者帮助用户规划旅游行程。总之有规律的领域,就可以引入深度学习,用大数据的产品提高效率和决策质量。
张宇坚信,“一个更有社会意义和商业价值的画卷”正在打开。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23