京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据创客,在中关村圆梦? (1)_数据分析师
“我刚毕业就选择回国创业,因为我觉得和美国相比,国内大数据技术应用还刚起步,还有很多潜力可挖。”普林科技公司副总经理王储向《中国电子报》记者表示。这位85后年轻人,拿到美国普林斯顿大学应用数学和计算机科学博士学位后毅然选择回国创业,公司去年注册成立,总部设在北京中关村。普林科技只是北京中关村创业大潮中的一朵浪花。2014年中关村新创办并实际经营的科技型企业超过1.3万家,是上年的2倍多,呈现井喷式增长;中关村发生的创业投资案例和投资金额均占全国40%以上。
在“创业中国中关村引领工程 (2015~2020年)”的带动下,北京欲打造中国“大众创业、万众创新”的标杆。
中关村孵化创业梦
2014年中关村新创办并实际经营的科技型企业超过1.3万家,是上年的2倍多。
日前,北京中关村创业大街挂牌成为“北京市众创空间集聚区”,极地国际创新中心等11家众创空间挂牌。这些众创空间将集成现有的各项科技政策支持、各类资金支持、专家团队支持,帮助创业者实现创业梦想。创业者只要带着创意,就可以在这里“零门槛”创业。
北京一直是科技领域创业沃土,中关村则是代表。中关村管委会主任郭洪告诉记者,中关村以打造“全球最具吸引力的创业中心”为目标,培育形成了以创新工场、车库咖啡、创客空间等创新型孵化器为代表的“众创空间”,与传统的孵化器相比,创新型孵化器呈现出“新服务、新生态、新潮流、新概念、新模式、新文化”的六新特征,不仅为创业者提供创业活动的聚集交流空间,而且为其按需提供个性化的创业增值服务,推动中关村兴起了新一轮科技创业热潮,形成了“大众创业、万众创新”的良好氛围,引领中国创业进入新时代。
数据显示,2014年中关村新创办并实际经营的科技型企业超过1.3万家,是上年的2倍多;2014年,中关村发生的创业投资案例和投资金额均占全国40%以上;涌现出小米、京东、亿赞普(F2C)等一批领军型创业企业。2014年中关村有13位创业者入选福布斯“中国30位30岁以下创业者”。
根据《创业中国中关村引领工程(2015~2020年)》设定的目标,到2020年中关村科技创业者超过20万人;新兴产业领域高质量创业企业超过10万家;天使投资人超过3000名,新设立天使投资和创业投资基金超过100支,投资金额超过1000亿元;中关村创业服务机构超过500家,创新型孵化器超过80家。
大数据成为创业目标
当前社会正从IT时代迈向DT时代,创客纷纷将目标投向大数据。
面对冉冉升起的DT时代,北京的创客们当然不愿放过任何机会,都在摩拳擦掌准备大干一场。“数据就好比石油,已成为一种"能源"。”这是记者接触到的创客共同的观点。
“如何在保护隐私的前提下让数据变现?这是我们创业的出发点。百度地图实时路况实现的根本原因是后台有大量的数据支撑,这些数据他们不会亲自收集,因为成本太高,而是向我们这种第三方数据服务公司购买。”专注于数据采集的数据堂科技股份有限公司创始人、公司总经理齐红威在接受《中国电子报》记者采访时表示。他认为,数据是“互联网+”必要的支撑,第三方数据服务公司成为大数据产业链必要的一环。作为新三板第一家大数据企业,数据堂公司定位和商业模式都很清晰。公司定位为数据服务型企业,通过对各类原始数据的有效采集形成“数据银行”,并通过对这些数据进行优化加工和制作后根据不同的市场需求为客户提供服务,从而获取利润。目前公司已完成A轮融资,2015年预计实现跨越式发展。
据了解,在齐红威的数据银行里,存着各类数据,这些数据有的是“众包”的方式获取,有的是直接采购,有的是通过数据爬虫在互联网上抓取,有的则是和政府合作获取。通过数据采集和制作,目前数据堂公司拥有了共300Tb用于论文写作、实验教学和产品研发的丰富的数据资源。另外,在近5万组数据中,有95%的数据永久免费从而使公司具有强大的竞争力,提高了竞争门槛。在技术方面,据介绍,数据堂拥有非结构化数据处理技术,支持多种语音识别和多钟语言的文本语义分析、小票识别、人脸识别等。
与数据堂的“数据银行”模式不同,普林科技着眼点则落在了大数据产业下游的应用端,即数据分析与预测。“如果把数据比作汽车用的汽油,那么数据建模分析则是汽车的引擎,只有通过引擎才能让能源释放。”王储这样说道。普林科技依托创业人员应用数学与计算机学科背景,研发了具有自主知识产权的算法,通过大数据建模与分析,为行业用户提供态势预测和决策支持。目前该公司已为P2P信贷平台公司研发了“风控云”产品,通过建立平台风控模型,帮助客户预测未来借款人的坏账概率,并进行信用分级,从而降低坏账率。此外,还与北京交通信息中心合作,通过分析基于GPS得到的北京6万辆出租车位置信息,建立车流量预测模型,助力智能交通发展。
门槛降低但难度提高
创业门槛降低,但意志力、人才队伍建设、整合资源能力考验创业成败。
推进大众创新创业已成为我国实现经济中高速增长和迈向中高端水平的新动力,也是释放人才红利与实现个人梦想的重要契合点。可以说,创业者遇到了好时代,当然创业本身就意味着要面对风险和挑战。
创业明星Picooc公司CEO张悦近日在由孵化平台太火鸟举办的“2015中国智能硬件蛋年创新大会”上向记者表示,创业说难也难,说容易也容易,实际上我们现在生活在一个最好的时代。现在的环境,对年轻的创业者来说是非常有帮助作用的。现在有社会的推动,有政府的支持,有朋友圈相互的影响。现在的创业相对以前来讲变得容易得多,这个时候社会环境变好了,可能就更考验了创业者的意志。
京东众筹负责人高洪偲也认为,所有创业没有成功的项目其原因还是要归结于创业者和创业团队,创业者能不能坚持下去至关重要。当遇到困难和瓶颈时,创业团队是否能够勇敢去面对,想办法去整合资源是关键。
除了坚持梦想外,人才队伍的建设也至关重要。王储表示,复合型人才队伍的建设是目前国内大数据产业普遍面临的发展瓶颈。一方面,国外大数据研究通常与产业结合起来,而国内研究大数据的人本身就很少,与实际生活结合的就更少。另一方面,大数据分析是行业化很深的应用,不同行业大数据分析建模不仅需要计算机科学知识,更需要行业知识,因此需要复合型人才。
“大数据产业实际上需要三类人:软件人才、数据处理加工的应用数学人才、行业应用的行业人才。”北京亚信数据有限公司总裁张灏表示,“将来我国大数据人才需求量将是互联网人才的三倍。”日前,亚信与北航、慧科教育集团已达成战略合作,推出大数据企业定制硕士培养项目,帮助亚信突破大数据人才瓶颈。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22