京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据创客,在中关村圆梦? (1)_数据分析师
“我刚毕业就选择回国创业,因为我觉得和美国相比,国内大数据技术应用还刚起步,还有很多潜力可挖。”普林科技公司副总经理王储向《中国电子报》记者表示。这位85后年轻人,拿到美国普林斯顿大学应用数学和计算机科学博士学位后毅然选择回国创业,公司去年注册成立,总部设在北京中关村。普林科技只是北京中关村创业大潮中的一朵浪花。2014年中关村新创办并实际经营的科技型企业超过1.3万家,是上年的2倍多,呈现井喷式增长;中关村发生的创业投资案例和投资金额均占全国40%以上。
在“创业中国中关村引领工程 (2015~2020年)”的带动下,北京欲打造中国“大众创业、万众创新”的标杆。
中关村孵化创业梦
2014年中关村新创办并实际经营的科技型企业超过1.3万家,是上年的2倍多。
日前,北京中关村创业大街挂牌成为“北京市众创空间集聚区”,极地国际创新中心等11家众创空间挂牌。这些众创空间将集成现有的各项科技政策支持、各类资金支持、专家团队支持,帮助创业者实现创业梦想。创业者只要带着创意,就可以在这里“零门槛”创业。
北京一直是科技领域创业沃土,中关村则是代表。中关村管委会主任郭洪告诉记者,中关村以打造“全球最具吸引力的创业中心”为目标,培育形成了以创新工场、车库咖啡、创客空间等创新型孵化器为代表的“众创空间”,与传统的孵化器相比,创新型孵化器呈现出“新服务、新生态、新潮流、新概念、新模式、新文化”的六新特征,不仅为创业者提供创业活动的聚集交流空间,而且为其按需提供个性化的创业增值服务,推动中关村兴起了新一轮科技创业热潮,形成了“大众创业、万众创新”的良好氛围,引领中国创业进入新时代。
数据显示,2014年中关村新创办并实际经营的科技型企业超过1.3万家,是上年的2倍多;2014年,中关村发生的创业投资案例和投资金额均占全国40%以上;涌现出小米、京东、亿赞普(F2C)等一批领军型创业企业。2014年中关村有13位创业者入选福布斯“中国30位30岁以下创业者”。
根据《创业中国中关村引领工程(2015~2020年)》设定的目标,到2020年中关村科技创业者超过20万人;新兴产业领域高质量创业企业超过10万家;天使投资人超过3000名,新设立天使投资和创业投资基金超过100支,投资金额超过1000亿元;中关村创业服务机构超过500家,创新型孵化器超过80家。
大数据成为创业目标
当前社会正从IT时代迈向DT时代,创客纷纷将目标投向大数据。
面对冉冉升起的DT时代,北京的创客们当然不愿放过任何机会,都在摩拳擦掌准备大干一场。“数据就好比石油,已成为一种"能源"。”这是记者接触到的创客共同的观点。
“如何在保护隐私的前提下让数据变现?这是我们创业的出发点。百度地图实时路况实现的根本原因是后台有大量的数据支撑,这些数据他们不会亲自收集,因为成本太高,而是向我们这种第三方数据服务公司购买。”专注于数据采集的数据堂科技股份有限公司创始人、公司总经理齐红威在接受《中国电子报》记者采访时表示。他认为,数据是“互联网+”必要的支撑,第三方数据服务公司成为大数据产业链必要的一环。作为新三板第一家大数据企业,数据堂公司定位和商业模式都很清晰。公司定位为数据服务型企业,通过对各类原始数据的有效采集形成“数据银行”,并通过对这些数据进行优化加工和制作后根据不同的市场需求为客户提供服务,从而获取利润。目前公司已完成A轮融资,2015年预计实现跨越式发展。
据了解,在齐红威的数据银行里,存着各类数据,这些数据有的是“众包”的方式获取,有的是直接采购,有的是通过数据爬虫在互联网上抓取,有的则是和政府合作获取。通过数据采集和制作,目前数据堂公司拥有了共300Tb用于论文写作、实验教学和产品研发的丰富的数据资源。另外,在近5万组数据中,有95%的数据永久免费从而使公司具有强大的竞争力,提高了竞争门槛。在技术方面,据介绍,数据堂拥有非结构化数据处理技术,支持多种语音识别和多钟语言的文本语义分析、小票识别、人脸识别等。
与数据堂的“数据银行”模式不同,普林科技着眼点则落在了大数据产业下游的应用端,即数据分析与预测。“如果把数据比作汽车用的汽油,那么数据建模分析则是汽车的引擎,只有通过引擎才能让能源释放。”王储这样说道。普林科技依托创业人员应用数学与计算机学科背景,研发了具有自主知识产权的算法,通过大数据建模与分析,为行业用户提供态势预测和决策支持。目前该公司已为P2P信贷平台公司研发了“风控云”产品,通过建立平台风控模型,帮助客户预测未来借款人的坏账概率,并进行信用分级,从而降低坏账率。此外,还与北京交通信息中心合作,通过分析基于GPS得到的北京6万辆出租车位置信息,建立车流量预测模型,助力智能交通发展。
门槛降低但难度提高
创业门槛降低,但意志力、人才队伍建设、整合资源能力考验创业成败。
推进大众创新创业已成为我国实现经济中高速增长和迈向中高端水平的新动力,也是释放人才红利与实现个人梦想的重要契合点。可以说,创业者遇到了好时代,当然创业本身就意味着要面对风险和挑战。
创业明星Picooc公司CEO张悦近日在由孵化平台太火鸟举办的“2015中国智能硬件蛋年创新大会”上向记者表示,创业说难也难,说容易也容易,实际上我们现在生活在一个最好的时代。现在的环境,对年轻的创业者来说是非常有帮助作用的。现在有社会的推动,有政府的支持,有朋友圈相互的影响。现在的创业相对以前来讲变得容易得多,这个时候社会环境变好了,可能就更考验了创业者的意志。
京东众筹负责人高洪偲也认为,所有创业没有成功的项目其原因还是要归结于创业者和创业团队,创业者能不能坚持下去至关重要。当遇到困难和瓶颈时,创业团队是否能够勇敢去面对,想办法去整合资源是关键。
除了坚持梦想外,人才队伍的建设也至关重要。王储表示,复合型人才队伍的建设是目前国内大数据产业普遍面临的发展瓶颈。一方面,国外大数据研究通常与产业结合起来,而国内研究大数据的人本身就很少,与实际生活结合的就更少。另一方面,大数据分析是行业化很深的应用,不同行业大数据分析建模不仅需要计算机科学知识,更需要行业知识,因此需要复合型人才。
“大数据产业实际上需要三类人:软件人才、数据处理加工的应用数学人才、行业应用的行业人才。”北京亚信数据有限公司总裁张灏表示,“将来我国大数据人才需求量将是互联网人才的三倍。”日前,亚信与北航、慧科教育集团已达成战略合作,推出大数据企业定制硕士培养项目,帮助亚信突破大数据人才瓶颈。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01