京公网安备 11010802034615号
经营许可证编号:京B2-20210330
收藏丨学习数据科学不可错过的优质资源
大约两个月前,我开始学习数据科学。我并没有统计学、数学、数据科学、工程学、经济学方面的学位。说实话,在学生时代,数学和统计并不是我的强项,我更擅长语言方面。
我拥有管理学的学士和硕士学位。我论文更偏向于文献综述,而不是运用定量研究方法。我的工作是时尚领域的买手。因此我的教育背景和工作中都很少与数学以及统计打交道。
那我是怎么开始学习数据科学的呢?我对“从数据中获得分析见解”这个观点非常感兴趣。因此,我下定决心去克服对数学和统计的恐惧感。
数据产生的速度非常快,我们可以在2天内生产出2003年以前的所有数据。如今可能更快只需要10分钟。并且这些数据中只有1%进行了分析,该领域充满了可能性。因此我认为我有必要投生数据分析领域,这就是我的初衷。
以下我将从线上课程、Youtube频道、TED演讲、博客、博客等方面列出数据分析领域不可错过的优质资源。
1. 线上课程 MOOC
Coursera创始人吴恩达和Daphne Koller
统计基础(Basic Statistics)
https://www.coursera.org/learn/basic-statistics
掌握统计学对于理解社会和行为科学的研究至关重要。在该课程中,你将学习统计学的基础知识。
机器学习(Machine Learning)
https://www.coursera.org/learn/machine-learning
吴恩达热门的机器学习课程,学习时需要提前掌握一定的编程、数学、统计方面的基础知识。
Python for Everybody
https://www.coursera.org/specializations/python
我强烈推荐这门。如果你像我一样,之前没有相关技术背景,那么通过这堂课能够很好的学习如何用Python进行编程。
2. Youtube频道
Youtube上有很多不错的频道,下面按类别区分。分为教程、会议演讲、训练营三个类型。
教程类型
Siraj Raval
https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A
人们对其意见不一,但我仍认为对于初学者而言这个频道是不错的开端。
Harrison Kinsley
https://www.youtube.com/user/sentdex
总体来说,对初学者而言这是不错的开端。这类YouTube教程主要偏向于如何解决某个问题。
Welch Labs
https://www.youtube.com/user/Taylorns34
当中不错的系列教程有:
Learning to see
https://www.youtube.com/watch?v=i8D90DkCLhI&list=PLiaHhY2iBX9ihLasvE8BKnS2Xg8AhY6iV
Neural Networks Demystified
https://www.youtube.com/watch?v=bxe2T-V8XRs&list=PLiaHhY2iBX9hdHaRr6b7XevZtgZRa1PoU
这两个课程主要针对初学者的,有助于掌握概念,绝对值得一看。
统计
Brandon Foltz’s Statistics 101
https://www.youtube.com/channel/UCFrjdcImgcQVyFbK04MBEhA
可汗学院的统计学系列(Khan Academy’s Statistics playlist)
https://www.youtube.com/watch?v=uhxtUt_-GyM&list=PL1328115D3D8A2566
数学
mathbff
https://www.youtube.com/channel/UCy5ev9EE-u5Iwbt2NHrcayw
当你遇到不熟悉的数学术语以及数学规则时,该频道是不错的选择。
Python
Chuck Severance’s Python for Everybody
https://www.youtube.com/user/csev
会议演讲类型
该类型中有些对于初学者来说可能不容易理解,但是可以从中把握数据科学的前沿动态。
PyData
https://www.youtube.com/user/PyDataTV
Open Data Science
https://www.youtube.com/channel/UCDS20hpBFiv_Kdp5Ibh0vew
Data Science Festival
https://www.youtube.com/channel/UCB02fDSj9GR4rhb1APMNclw/feed
Scipy: Scientific Computing with Python
https://www.youtube.com/user/EnthoughtMedia/playlists
O’Reilly
https://www.youtube.com/user/OreillyMedia
Goto
https://www.youtube.com/user/GotoConferences
Google Developers
https://www.youtube.com/channel/UC_x5XG1OV2P6uZZ5FSM9Ttw
KDD 2016
https://www.youtube.com/channel/UCPsUUDUlcTJuP-fRa7z85aQ
KDD 2017
https://www.youtube.com/channel/UC_sfvZvvPUbOQhDs_cqlx_A
训练营类型
General Assembly
https://www.youtube.com/user/gnrlassembly
Data Science Dojo
https://www.youtube.com/user/DataScienceDojo
3. TED演讲
我特别喜欢TED演讲。通过各种话题的演讲者,我总能发现新的事物,获得灵感。
值得注意的是TED演讲分为: TED Talks 和 Tedx Talks。
TED Talks 和 Tedx Talks的区别在于,前者偏向于从全球的角度把握,而后者主要是由当地社区举办。
TED Talks
https://www.youtube.com/user/TEDtalksDirector
TEDx Talks
https://www.youtube.com/user/TEDxTalks
下面列出一些热门的数据科学TED演讲:
我们都是数据科学家
(We’re All Data Scientists | Rebecca Nugent)
https://youtu.be/YMnqPTLoj7o
数据科学家最重要的技能
(The most important skills of data scientists | Jose Miguel Cansado)
https://www.youtube.com/watch?v=qrhRfPY4F4w&feature=youtu.be
给我看数据—成为你自己的专家
(Show me the data — becoming an expert in yourself | Talithia Williams )
https://www.youtube.com/watch?v=TDCYJ3_gx2w&feature=youtu.be
通过讲故事,让数据更有意义
(Making data mean more through storytelling | Ben Wellington)
https://www.youtube.com/watch?v=6xsvGYIxJok&feature=youtu.be
数据的权重
(The Weight of Data | Jer Thorp)
https://www.youtube.com/watch?v=Q9wcvFkWpsM&feature=youtu.be
播客
当然,短短几十分钟的播客不会让你成为专家,但你会听到专业的数据科学家如何谈论相关主题,并将其应用于实际问题。
Data Skeptic
https://dataskeptic.com/
主持人Kyle Polich和Linh Da用通俗易懂的语言解释各种数据科学概念,当中不会涉及到数学或计算。
Partially Derivative
http://partiallyderivative.com/
很遗憾,该播客在2017年9月5日最后一期之后就停播了。通过该播客,我学习到了如何在特定情况下应用相应的机器学习算法。
Partially Derivative的主持人:左起Jonathon Morgan、Vidya Spandana、Chris Albon
Linear Digressions
http://lineardigressions.com/
主持人是数据科学家Katie Malone和UI工程师Ben Jaffe。他们从不同的角度对数据科学进行了阐述。
Learning Machines 101
http://www.learningmachines101.com/
关注机器学习的播客。建议你从头开始听,因为可以让你了解该领域的发展历程,积累必要的理论知识。
Stats + Stories
http://www.npr.org/podcasts/530134710/stats-stories
该播客主要关注统计和新闻方面。由于许多数据科学概念来自统计学,学习如何像统计学家一样思考是非常有用的。
More or Less
http://www.bbc.co.uk/programmes/p02nrss1/episodes/downloads
BBC的播客,主要关注人们身边的数学和统计学问题。
博客
数据科学方面有许多优质的博客,这是可以利用RSS来订阅相关内容。
出版商博客
Data Blog——The Guardian
https://www.theguardian.com/data
英国卫报的博客,分享新闻背后的数据。
Data——O’Reilly Media
https://www.oreilly.com/topics/data
分享关于数据领域的高质量文章
组织机构博客
Facebook Research Blog
https://research.fb.com/category/data-science/
关于数据科学的博客,当中包括各种主题的研究论文; 自然语言处理,计算机视觉等。
AWS AI Blog
https://aws.amazon.com/blogs/ai/
Tableau Blog
https://www.tableau.com/about/blog
Bloomberg——Graphics
https://www.bloomberg.com/graphics
具有数据可视化的经济新闻报道。
Data at GDS Blog
https://gdsdata.blog.gov.uk/
英国政府的数字服务数据博客,从中能够政府对数据的使用情况。
数据社区/门户
FiveThirtyEight
http://fivethirtyeight.com/
美国著名统计学家Nate Silver的网站,主要关注政治和体育方面,有时会在Github中分享数据集。
Fiverthirtyeight风格的图形非常有名。
Analytics Vidhya
https://www.analyticsvidhya.com/
专注数据科学的商业分析方面,包括相关教程、技巧等。
Dataconomy
http://dataconomy.com/
侧重于数据科学在现实中的应用。
KDnuggets
http://www.kdnuggets.com/
著名的数据网站,包括各种主题、新闻、教程等。
Dataquest Blog
https://www.dataquest.io/blog/
包括在线数据科学课程,教程类型文章很有帮助。
个人博客
Jer Thorp: blprnt.blg
http://blog.blprnt.com/
数据可视化方面的专家。
西欧的酒店地图,显示巴黎、伦敦、马德里和罗马等首都城市的酒店密度。
(图片来自Jer Thorp: flickr.com/photos/blprnt/)
Data Science 101
http://101.datascience.community/
Demystifying Data Science的主讲人之一,Ryan Swanstrom。关于如何学习数据科学的不错资源。
Dr. Randal S. Olson
http://www.randalolson.com/blog/
分享如何将数据科学应用于现实生活中的问题。
个人兴趣(时尚和零售方面的数据科学)
Net-A-Porter Technical Blog
http://techblog.net-a-porter.com/
Lyst’s Engineering Blog
https://making.lyst.com/
Etsy Technicla Blog: Code as Craft
https://codeascraft.com/
Stitch Fix Technical Blog
http://multithreaded.stitchfix.com/blog/
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22