如何有效的成为一名数据科学家 人们总是问我如何有效的成为一名数据科学家。我的经历是先成为一名软件工程师,然后读了数据科学相关的PhD (是在它变成热点之前)。在这篇文章里,基于我在这个领域的经验总结, ...
2016-04-08摘要:决策树主要用来描述将数据划分为不同组的规则。第一条规则首先将整个数据集划分为不同大小的子集,然后将另外的规则应用在子数据集中,数据集不同相应的规则也不同,这样就形成第二层数据集的划分。一般来说 ...
2016-04-07大数据挖掘技术之DM经典模型(下) 接着上篇大数据挖掘技术之DM经典模型(上)文章,接下来我们将探讨朴素贝叶斯模型、线性回归、多元回归、逻辑回归分析等模型。 4、朴素贝叶斯模型 表查询模型简单有效 ...
2016-04-07大数据挖掘技术之DM经典模型(上) 实际上,所有的数据挖掘技术都是以概率论和统计学为基础的。 下面我们将探讨如何用模型来表示简单的、描述性的统计数据。如果我们可以描述所要找的事物,那么想要找到它就 ...
2016-04-07R语言企业级数据挖掘应用 在互联网企业,在分析端使用闭源的商用软件几乎是不可能的,原因很简单:成本太高,不管是使用,还是研发及维护。 但我个人觉得这可能还不是最主要的原因,对于互联网企业来说,数据虽 ...
2016-04-07数据挖掘基础:分词入门 谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头布局深度学习。随着社会化数据大量产生,硬 件速度上升、成本降低,大数据技术的落地实 ...
2016-04-07大数据分析中的八大趋势 Remarketer的首席数据科学家Dean Abbott直接奔向了云计算。大数据和分析的领先优势,其中包括用来存储原生格式的大量数据的数据湖泊,当然,云计算技术也在快速前进。虽然技术选项还远 ...
2016-04-07五个未来最吃香的IT技能 数据分析排第一 在2020年,专业技术知识将不再是IT部门的唯一领域了。整个公司/组织的员工应当要理解如何把IT技术运用到他们的工作之中。但未来学家和IT专家说,最吃香的IT相关技术包 ...
2016-04-07摘要:如果你从来没有编程经验,也没有比较熟悉的统计软件,那么学习R可能会比较困难。这个学习路径主要针对新手。关于R有很多优秀资源,这里介绍的一些在线课程、书籍和更多让你尽快学会R。 步骤1:你为什么要学 ...
2016-04-06数据分析师常见的10个问题 1、如何做好数据分析? 分析师成长是通过“干”、\"思\"、“熬”出来的。干:多做。哪些是临时需求。你要做各种各样的分析;思:你在边干的过程中,要边思考,边总结,只有这 ...
2016-04-06让数据决策你的行为—拉勾网数据分析 我们每天都在产生数据,出行,社交,购物,吃饭 等等,每一个行为伴随着数据的产生,如果将这些数据收集起来,并加以处理分析便可以反过来影响你的行为。 举个最 ...
2016-04-06我们在数据挖掘中迷失了什么? 当我们沉浸在亲手构建的模型里的时候,是否会理智地跳出来,重新审视一下,我们所忽略的会不会正是客户所需求的呢? 1.太关注训练 就像体育训练中越来越注重实战训练, ...
2016-04-06你用Python做过什么有趣的数据挖掘项目? 大概一年多以前,和几个小伙伴均认同一个趋势:觉得通过技术手段获取网上越来越丰富的数据,并基于这些数据做分析及可视化,必能产生有价值的结果,帮助大家改善生活 ...
2016-04-06数据时代的反爬虫绝技 网络爬虫已经成了很普及的网络技术,会代码的可以自己捣鼓一个高级的“人工智能”爬虫,不会的也可以从网上下载一个开源的,然后找个机器或一些代理服务器,就可以肆无忌惮的薅羊毛了。轻 ...
2016-04-06App数据分析之旅,如何收集数据? 为什么要针对App收集数据,想必大家能够举出很多理由。大家可以想一下,尽量不要设计到数据后期的分析,不要涉及产品优化,不要设计用户体验,更不要设计运营优化,等等。因 ...
2016-04-06“当你在深夜遇到系统挂了和数据损坏,有什么办法可以避免那些痛苦和头痛?” 这是DJ·Patil在最近的CTO峰会提到的。他是RelateIQ前任产品副总裁,和美国现任首席数据科学家,Patil总结所有产生变革的经验教训和失 ...
2016-04-05如何面对PB级别数据的架构变迁? 面对PB级别数据存储,我们一路走来也踩过很多坑,这里就直接进入主题了,给大家分享一下监控宝系统架构变迁的两个比较重要的点。 一、Redis的扩展 我们面临的第一个的问题 ...
2016-04-05基于你的点赞轨迹,数据挖掘可以探知你的性格秘密 整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质 ...
2016-04-05懂你的推荐算法,推荐逻辑是怎样的? 作为一个喜欢思考人生的美男子,我时常感慨,现在这个年代,人们上网获取信息的成本真的好低。智能手机,人手一台,打开3G就能上网,百度一搜,什 么都有。当然百度上搜出 ...
2016-04-05非一般的数据挖掘机:关联规则法 机器学习中的许多数据挖掘方法主要是针对数值型数据的,算法也很偏向数理方法(例如支持向量机)。而分类数据(非数值型数据),其本质不过是简单的计数,针对这类数据的一个简 ...
2016-04-05Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08