作者 | 李明江 张良均 周东平 张尚佳 来源 | 大数据DT Python作为一个设计优秀的程序语言,现在已广泛应用于各种领域,依靠其强大的第三方类库,Python在各个领域都能发挥巨大的作用。 ...
2019-11-29作者 | zsx_yiyiyi 来源 | python大本营 25个Matplotlib图的汇编,在数据分析和可视化中最有用。此列表允许您使用Python的Matplotlib和Seaborn库选择要显示的可视化对象。今天给大家分享前面 ...
2019-11-28作者 | InfoQ 来源 | infoqchina 10 月 30 日,Python 之父 Guido 大牛宣布退休,离开 Dropbox。 他发推文说,“这件事感觉既苦涩又甜蜜:苦涩的是,我马上要离开 Dropbox,现在已经退休 ...
2019-11-28作者 | Matiur Rahman Minar、Jibon Naher 来源 | 机器之心 摘要 深度学习是机器学习和人工智能研究的最新趋势之一。它也是当今最流行的科学研究趋势之一。深度学习方法为计算机视觉和机 ...
2019-11-28作者 | zglg 来源 | Python与算法社区 python里[] 表示一个列表,对容器类型的数据进行运算和操作,生成新的列表最高效、快速的办法,就是列表生成式。 它优雅、简洁,值得大家多多使用 ...
2019-11-27作者 | Python3分钟 来源 | python3m 静态类型 vs 动态 编程语言 强类型 vs 弱类型 编程语言 1 类型检查 类型检查是一个验证和施加类型约束的过程,编译器或解释器通常 ...
2019-11-27作者|Kin Lim Lee 编译|量子位 最近,大数据工程师Kin Lim Lee在Medium上发表了一篇文章,介绍了8个用于数据清洗的Python代码。 数据清洗,是进行数据分析和使用数据训练模型的必经之 ...
2019-11-27作者 | Josh Thompson 来源 | 数据派THU Choosing the Right Clustering Algorithm for your Dataset - KDnuggets 聚类算法十分容易上手,但是选择恰当的聚类算法并不是一件容易的事 ...
2019-11-26作者 | 人工智能大数据与深度学习 来源 | Datawhale 机器学习和数据科学都是广义上的术语,它们涉及超级多的领域以及知识,一位数据科学家所做的事情可能与另一位有很大的不同,机器学习工程 ...
2019-11-26来源 | 21世纪经济报道 中国科学院院士、中国人民解放军军事科学院副院长梅宏认为,当前大数据应用尚处于初级阶段,根据大数据分析预测未来、指导实践的深层次应用将成为发展重点。 他指出,预 ...
2019-11-26作者 | 机器之能 来源 | 机器之心 1024刚落幕,码农们得以欢度属于自己的节日,备受瞩目。作为互联网公司中最为核心与主流的群体,程序员的地位不容忽视。 尤其在最近两年,随着 “互联 ...
2019-11-25作者 | PRESSone 来源 | 怀左同学 先给你讲个故事,看看你有没有类似的经历。有一天,你去参加同学聚会,和老友们举杯畅谈,他们告诉你,不学编程就要 out 了,从全球趋势来看,编程这把火已 ...
2019-11-25作者 | 诸葛君 来源 | 诸葛io数据教练 什么是假设分析法? 在解释假设分析法之前,我们来做一道小学6年级的数学题: “小明和妈妈买了10本书,正好花了100块钱,书的单价有8块钱和13 ...
2019-11-25前言 缺失值的识别 需要说明的是,判断数据是否为缺失值NaN,可以使用isnull“方法”,它会返回与原数据行列数相同的矩阵,并且矩阵的元素为bool类型的值,为了得到每一列的判断结果,仍然需要any“ ...
2019-11-25作者 | Adrian Rosebrock 编译 | 数盟 如果你对深度学习和卷积神经网络感兴趣,但是并不知道从哪里开始,也不知道使用哪种库,那么这里就为你提供了许多帮助。 在这篇文章里,我详细解 ...
2019-11-22作者 | Vihar Kurama 编译 | 荷叶 来源 | 云栖社区 摘要:深度学习背后的主要原因是人工智能应该从人脑中汲取灵感。本文就用一个小例子无死角的介绍一下深度学习! 人脑模拟 ...
2019-11-22作者 | 刘顺祥 来源 | 数据分析1480 数据分析过程中最头疼也是工作量最大的部分算是探索和清洗了——探索的目的是了解数据,了解数据背后隐藏的规律;洗的目的则是为了让干净的数据进入分 ...
2019-11-20作者 | 常国珍、赵仁乾、张秋剑 来源 |《Python数据科学:技术详解与商业实践》 数据清洗是数据分析的必备环节,在进行分析过程中,会有很多不符合分析 ...
2019-11-20作者 | 小隐 来源 | 淘气面包 原文 | 教你怎样用python进行语音识别 网上找到一些例子,有一些成熟的模型,可以将语音转成文字。例如Cloud Speech API,但是需要你使用google云平 ...
2019-11-19作者 | David Amos 编译 | 廉洁 来源 | AI科技大本营 亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 ...
2019-11-19在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30