作者 | 周伟能 来源 | 小叮当讲SAS和Python Python在机器学习(人工智能,AI)方面有着很大的优势。谈到人工智能,一般也会谈到其实现的语言Python。前面有几讲也是关于机器学习在图像识别 ...
2019-11-19作者 | a1131825850疯子 来源 | Python爬虫scrapy 1.背景 要识别两张图片是否相似,首先我们可能会区分这两张图是人物照,还是风景照等......对应的风景照是蓝天还是大海......做一系列 ...
2019-11-19作者|Gartner 来源|网络大数据 全球领先的信息技术研究和顾问公司Gartner于近日公布了企业机构在2020年需要研究的重要战略科技发展趋势。 Gartner将战略科技发展趋势定义为具有巨大颠 ...
2019-11-18作者 | Rob Matheson 编译 | CDA数据分析师 New AI programming language goes beyond deep learning 麻省理工学院的一个研究小组正在努力让初学者更容易进入人工智能的领域,同时也 ...
2019-11-18作者 | Jansfer 来源 | AMiner Artificial intelligence trends of 2019 2019年给我们带来了一些我们不可以错过的最新人工智能趋势。 人工智能已经风靡全球。它被看作是技术给人 ...
2019-11-18作者 | Martin Heinz 来源 | 机器之心 介绍 Python 炫酷功能(例如,变量解包,偏函数,枚举可迭代对象等)的文章层出不穷。但是还有很多 Python 的编程小技巧鲜被提及。因此,本文会试着介 ...
2019-11-18作者 | 网络大数据 来源 | raincent_com 随着物联网的演变和发展,所有可以想象到的东西(或事物)和产业都将变得更加智能:智能家居和智慧城市、智能制造机械、智能汽车、智能健康等等。无数 ...
2019-11-18作者 | AlfredWu 来源 | Alfred数据室 金三银四金九银十,又到了每年的秋招时节。在各企业HR狂刷简历企图招贤纳士的同时,内部年轻员工心中实则也暗流涌动:他们有些已提交了辞呈,有些在骑 ...
2019-11-18作者 | 陈老师 来源 | 接地气学堂 有同学问:经常听到“搭建运营分析体系、搭建业绩监控体系、搭建商品分析体系”等等要求。可到底数据分析体系是什么?似乎经常看到的,只有AARRR五个字母, ...
2019-11-14作者|skura 来源|AI开发者 python 就像一件艺术珍藏品! python 最大的优点之一是它可以广泛地选择模块和包。它们将 python 的功能扩展到许多流行的领域,包括机器学习、数据科学、web ...
2019-11-14作者 | Tiernan Ray 编译 | CDA数据分析师 硅谷创业公司Cerebras Systems周一推出了世界上最大的专为AI设计的芯片。Cerebras首席执行官兼联合创始人Andrew Feldman与ZDNet讨论了深度学习网络 ...
2019-11-14作者 | CDA数据分析师 生成对抗网络(GAN)是一种用于训练深度卷积模型以生成合成图像的体系结构。 尽管非常有效,但默认GAN无法控制生成的图像类型。信息最大化GAN(简称InfoGAN)是GAN架构的 ...
2019-11-13作者 | Cameron Warren 来源 | 图灵TOPIA 近日,数据科学家Cameron Warren就数据科学和商业的交集,以及传统数据科学思想的挑战,发表了自己的看法。 过去的6年间, Warren在Adobe, USAA ...
2019-11-13一、数据科学家的工作模式与组织结构 1. 数据驱动还是业务驱动 然而从自身能力的发展、数据驱动逐渐成为主要的工作模式的情况来看,数据科学家需要思考如何将数据驱动的模式做得更好,并且愿意承担更多责 ...
2019-11-12作者 | 彭鸿涛 张宗耀 来源 | 大数据DT 一次偶然的机会,有一位正在深造机器学习方面学位的朋友问了笔者一个问题:如何成为一名合格的数据科学家? 这个问题回答起来亦简亦难。简单回答 ...
2019-11-12作者 | 王健宗 瞿晓阳 来源 | 大数据DT 01 人工智能发展历程 图1是人工智能发展情况概览。人工智能的发展经历了很长时间的历史积淀,早在1950年,阿兰·图灵就提出了图灵测试机,大意是 ...
2019-11-12作者 | GreyCampus 来源 | 网络大数据 随着科技的不断进步,工业世界的“饥饿游戏”越演越烈,如何始终在市场保有竞争力? 是的,快速获得新兴行业知识技能的人在一定时间内将会更容易成 ...
2019-11-11作者 | Prakhar Ganesh 编译 | 安然 近日,发表在《DataScience》上的一篇文章,使用深度学习方法,从数据处理、循环网络、RNN上的LSTM、CNN-LSTMs等方面介绍了时间序列分析,同时解释了时间 ...
2019-11-07作者 | 刘顺祥 来源 | 数据分析1480 这一期将分享我认为比较常规的100个实用函数,这些函数大致可以分为六类,分别是统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列 ...
2019-11-07作者 | 罗钰靖、阿米 来源 | DT财经 数据 | 罗钰靖、李飞、吕三利 流量明星+电影≠流量电影 2019年,可谓是易烊千玺真正意义上的千禧年。在《上海堡垒》已经沦落到与《逐梦演艺圈 ...
2019-11-07在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29