京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在大家的眼中,科学家的形象可能是一位表情严肃、着装单一、不修边幅、戴着一副厚重眼镜且天庭饱满,发际线无限上移的中老年理共男。但实际上,他们正式体面,幽默无比,可谓是集涵养和趣味于一身的真正撩妹达人!
那么现实中,你是否有见过真正的数据科学家呢?
数据科学家,一个大数据时代的新兴称号,被《哈佛商业评论》中被誉为“21世纪最性感的职业”,2015年,美国白宫首次设立数据科学家的岗位。
他们可能不发表学术论文,没有科研项目,也没有得过学术大奖,但在商业帝国里扮演着至关重要的角色。他们是技术驱动,没日没夜与数据打交道的匠人;他们是创意源泉,为业务出谋划策的参谋者;他们是幕后之王,未雨绸缪粮草先行。
在国内,CDA以寻找数据科学家活动,汇聚了一批真正称得上大佬的实战派先锋,无论是在商业领域摸爬滚打,还是在学术界科研探索,都硕果累累,名副其实。所谓前人栽树后人乘凉,他们为数据科学做出了模范般的躬先表率。CDA也授予其“荣誉数据科学家”称号。
荣誉数据科学家
九屠

曾就职于阿里巴巴·饿了么,集团首席数据架构师、P10科学家。负责饿了么、百度外卖的大数据技术统筹。
2014年加入百度,先后带团队建设为百度地图6大Place场景做数据分析,后专注于百度外卖大数据生态从0开始孵化并最终完善。自主研发涉及到数据采集3大平台、开放式ETL4件套、OLAP分析平台、Adhoc、大数据分布式调度、数据集市、数据仓库等,另外技术驱动数十个辅助业务分析角色的分析挖掘平台。为大数据研发打造离线、实时数据整套解决方案,目前构建并推广AI学习平台系统;在AI和大数据技术创新层面,作为发明型专利第一发明人拥有44项发明。
李御玺
国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问,CDA命题组负责人。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。
服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
赵卫东
东南大学博士,复旦大学博士后,主要负责本科生和各类研究生大数据核心技术和商务数据分析等课程的教学。商务智能被评为上海市精品课程,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括商务数据分析和大数据分析等。主持2项国家自然科学基金以及上海市浦江人才、企业合作课题等20多项项目。已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等国内外刊物和学术会议发表论文90多篇。
出版著作《智能化的流程管理》、《数据挖掘实用案例分析》以及教材《商务智能(第四版)》、《机器学习》、译作《商务智能 数据分析的管理视角(第四版)》、《人机共生——洞察和规避数据分析中的机遇与误区》等10多部。获得上海市2015年上海市科技进步二等奖。
付波
博士,电子科技大学副教授,2009年获电子科技大学工学博士学位,2007-2008加拿大Univ. of Guelph的ARIS实验室访问学者。
多年从事模式识别、信号处理和机器学习相关工作,曾先后主持/参与国家自然科学基金、国家863及省市各项课题20余项。在包括IEEE Trans. IFS, SPL, Int. Jour. of PR, PRAI等国内外权威期刊、重要国际会议上发表论文30余篇,其中SCI检索20余篇。合作参与编写专著3部。获国家授权发明专利7项,省市科技进步奖2项。曾担任国家自然基金及多个期刊或会议的评审人和特约审稿人。目前,主要关注医疗健康大数据分析和产业化运用,近几年主持或合作医疗及人工智能相关科研项目400余万,并参与创办了2家科技公司。
阎志涛
Talkingdata,研发副总裁,负责企业数据治理,数据平台及客户精准营销等实务。
王学武
首席数据官。毕业于华中科技大学计算机专业。PRINCE2,PMP,CMMI评审员,IBM电子商务架构师,工信部项目管理工程师,工信部软件设计师。
具有12年的项目管理与技术研发经验,曾参与实施某航企多个核心的商业智能、数据仓库项目;曾作为该企业工程过程管理组的Lead,负责推进CMMI L3评审工作。目前专注于大数据、机器学习、自然语言处理、人工智能等创新技术的研究和在行业的应用。
薛松
美国佛罗里达大学管理学与经济学硕士,曾于美国微策略公司等多家企业担任数据科学家,现任某初创公司数据科学总监。
设计并主持多项大数据与人工智能项目,项目内容涵盖多源异构数据自动化采集、社交媒体舆情分析、多语言自然语言处理、图数据库集成与图算法应用等领域。长期为全球500强客户提供数据产品咨询,搭建企业级大数据平台与应用,在安全、交通、金融、媒体等行业的大数据项目管理方面有丰富经验。
教学案例
以上的实战派数据科学大佬们,也正式成为了CDA数据分析研究院荣誉科学家成员,共同参与制定CDA LEVEL 3数据科学家人才标准大纲及数据科学家精英培训,将自身在大数据发展这几年的实战成果,以教学案例的形式倾囊相授。案例包括:
案例一
大数据指标模型治理与实践
案例介绍:
大数据对业务数据ETL处理后,面临在数据仓库层面对业务词库定义、指标建模、元数据统一等问题;后期对外数据通过产品化和AdHoc方式交付数据,存在指标定义相同,但是语义理解存在较大偏差,如何进行指标模型的多口径计算逻辑统一,避免繁琐的人工维护和迭代,是本议题主张的部分;通过一处定义数据指标,多处交付统一的模型抽象、定义、训练和交付整体实践。
技能涉及:
元数据、大数据计算、ETL、数据建模、计算口径、血缘关系、语义理解、统一模型。
案例二:
用户画像在O2O互联网场景的实践
案例介绍:
在外卖的物流场景下的调度是一个时空最优解的模型评估,模型的演进的过程中,都有重要的特征支持着变革,边界非常清晰。模型演进对于画像部分,是开始在配送服务精细化运营的落地步骤;画像是为了满足个体的真实差异而对个性化的支撑方式。分享围绕互联网企业在智能调度系统方向上从的逐步演进,画像贯穿在整个生态当中,在大刀阔斧的业务版本演进同时,能够细致入微的解决落地场景的实践。
技能涉及:
案例三
文本挖掘实战
案例介绍:
文本分析(Text analysis)是文本挖掘、信息检索的一个基本问题。它将文本中抽取出的特征词进行量化,进而表示其文本信息。由于文本是由特定的人进行编撰的,文本的语义结构不可避免地会反映人的特定立场、观点、价值和利益。通过大量数据的支撑,并结合文本内容的分析,可以推断出文本编撰者的意图和目的,以进行各种不同场景应用。
技能涉及:
分词、词性标注、命名实体标订、情绪标订、词关联分析、文件分类、文件摘要、文件聚类、文字云
案例四
生鲜智能补货
案例介绍:
生鲜补货在特定行业模式下的特点与面临的问题,商业模式与智能补货相结合中用到的智能算法,相关架构与业务效果,以及在系统的整个构建过程,生鲜智能补货是一个跟、供应链、仓储、物流、人员配送、促销、商品展现、推荐、广告、渠道运营等多系统协同的复杂系统,尤其生鲜类商品,保质期短,口味、消费者人群、地域分布等都与传统电商商品具有很大的差异。目前生鲜电商面临的最大问题就是运营成本难以下降,传统电商运营生鲜面临着保质期太短,对新鲜度的极高要求,冷链问题解,配送耗材损耗居高不下等问题。面对这样的问题,可以从供给侧通过智能补货系统对商品进行预测控制,降低损耗,降低周转期,提高库容利用率。
更多业界成熟案例都会融入到CDA LEVEL 3数据科学家精英培训中!
Lesson周期:
三个月,线上约20课时,线下50+课时(周末面授)
Lesson目标:
将数据分析师、数据工程师打造为数据科学家
2019年2月23日开学,限额30人哟,机不可失——https://www.cda.cn/kecheng/53.html
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17