作者 | CDA数据分析师 数据科学是一个研究领域,涉及通过使用各种科学方法,算法和过程从大量数据中提取见解。它可以帮助您从原始数据中发现隐藏的模式。 由于数理统计,数据分析和大数据的发展 ...
2019-10-15作者 | 草核儿 来源 | 木东居士 看这个标题,就感觉是一篇焦虑文。 好了,本草核儿今天的确是来贩卖一些焦虑的,但是,放心,按照我的尿性,正文的最后部分都是正能量的。 35岁只是 ...
2019-10-15作者 | Japson 来源 | 木东居士 0x00 前言 天下苦数学久矣! 对于很多想要入门机器学习的工程师来说,数学是通往AI道路上的第一支拦路虎。一些已经工作的同学不得不捡起早已还给老师 ...
2019-10-15作者 | 磐怼怼 来源 | 磐创AI 数据科学家是“在统计方面比任何软件工程师都要出色,在软件工程方面比任何统计学家都出色的人”。许多数据科学家都有统计学背景,但很少有软件工程经验。我是 ...
2019-10-14作者 | Jansfer 来源 | AMiner 2019年是数据和分析领域的结构转变的一年,这一年发生了大量的企业收购与合并,许多企业的业绩发生了陡崖式的变化。鉴于此,来自全世界数千名数据科学家和业务 ...
2019-10-14作者 | 张栋 来源 | 雷锋网 “现在视频监控与人脸识别的应用太多了,对数据的安全防护工作刻不容缓。” 事件一:9月初,在一场围绕教育场景概念演示活动中,某公司展示的一幅课堂行为分 ...
2019-10-14作者 | 吹牛Z 来源 | 数据不吹牛 原文 | Python数据分析实战基础 | 清洗常用4板斧 首先,导入案例数据集。因为案例数据存放在同一个Excel表的不同Sheet下,我们需要指定sheetname分别 ...
2019-10-12作者|Olah & Carter 编译|CDA数据分析师 Attention and Augmented Recurrent Neural Networks 循环神经网络是深度学习的主要内容之一,允许神经网络处理文本,音频和视频等数据序列 ...
2019-10-12来源|AIT News Desk 编译|CDA数据分析师 Dotscience Emerges from Stealth to Eliminate the Biggest Pain Points of Operationalizing AI in the Enterprise Dotscience是DevOps机 ...
2019-10-12数据处理是对纷繁复杂的海量数据价值的提炼,而其中最有价值的地方在于预测性分析,即可以通过数据可视化、统计模式识别、数据描述等数据挖掘形式帮助数据科学家更好的理解数据,根据数据挖掘的结果得出预测性决策 ...
2019-10-11作者 | 吹牛Z 来源 | 数据不吹牛 据某数据来源统计,学习了Pandas的同学,有超过60%仍然投向了Excel的怀抱,之所以做此下策,多半是因为刚开始用Python处理数据时,选择想要的行和列实在太痛 ...
2019-10-11对任何新兴技术都存在误解,但在人工智能方面,误解似乎特别明显。也许这是因为人工智能潜在影响的范围已经产生了一定的神话地位。 对于试图在其组织中确定AI实际应用程序规模的IT领导者来说,这成为一个特殊 ...
2019-10-11作者:Daniel Faggella 编译 | CDA数据分析师 What is Machine Learning? 在谷歌搜索中输入“什么是机器学习?”打开了一个潘多拉的论坛,学术研究和这里说的 - 本文的目的是简化机器 ...
2019-10-10作者 | Alex Adam 来源 | 机器之心 很多人都大概了解对抗样本是什么:在数据中加入人眼不可察觉的扰动,使得模型对数据的标签预测发生混淆和错误。但是,这句话背后的技术细节是什么?怎样才 ...
2019-10-10作者 | AlfredWu 来源 | Alfred数据室 最近有很多人在问,我是如何收集网络的数据,如何进行数据处理、数据分析以及可视化呈现的。 也有人问的更具体,关于Python数据分析的一些问题。到 ...
2019-10-10作者 | Tekla S. Perry 编译 | 机器之心 U.S. Engineering Salaries Jump; Smartphone Developers Win Big 都是学工科,该入哪一行?薪资水平是人们考量未来职业的重要因素。IEEE 刚 ...
2019-10-09作者 | 大喵 来源 | 物联网空间站 什么是数据湖,它是什么工作原理?它又是如何作用于大数据分析的?它们的驱动因素和优缺点又是什么? 一般情况下,要使大数据项目成功,至少需要两件事 ...
2019-10-09作者 | 中国统计网 来源 | cntongji 最近听到大家说的最多的话就是,在工作中总是没有数据分析思路,我应该怎么办呢?今天就来给大家分享一下,如何锻炼自己的数据思维,还有实例模型讲解哦~ ...
2019-10-09作者 | 小强 来源 | 小强职场说 昨天,前中建的同事阿陈邀请我吃饭,我们同一年进入公司,不同的是我在中途离开转行互联网,而他留在了公司。 这一晃就是几年过去,大家彼此寒暄中,我才 ...
2019-09-29作者&来源 | 猎聘,转载需授权 ※本报告核心洞察 AI&大数据人才在全球爆发式发展,而另一面在全球范围内呈现严重人才荒。中国人工智能人才缺口超过 500 万,大数据人才缺口高达 150 万。 ...
2019-09-29在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29