好枪手是靠子弹喂出来的,好分析师是靠大量项目实践沉淀出来的。 作者 | 老七 来源 | 鸟哥笔记 1. 不懂业务,分析就仅仅只是提数 1)如果懂业务,你就不会在日活 ...
2019-12-11作者 | Arseny Kravchenko 编译 | ronghuaiyang 人是不完美的,我们经常在软件中犯错误。有时这些错误很容易发现:你的代码根本不能工作,你的应用程序崩溃等等。但是有些bug是隐藏的,这 ...
2019-12-11作者 | 数据海洋 来源 | haiyangxinyong “数据质量是生命线”,不管是对数据从业者来说,还是针对数据应用者来说,是一样重要的,所以在SQL语言来提取数据的时候一定要保证数据的准确性。 ...
2019-12-10结合自己的成长经验,从一个数据分析师成长为管理过近百人的数据团队的负责人,也许有不少经验和走过的坑可以总结,从而帮助大家。所以决定接下来写一个《数据分析师》成长记录。同时也回答收集到的各个问题 ...
2019-12-10作者 | Oleksii Kharkovyna 编译 | 机器之心 线性代数是 AI 专家必须掌握的知识,这已不再是个秘密。如果不掌握应用数学这个领域,你永远就只能是「门外汉」。当然,学习线性代数道阻且长。 ...
2019-12-10编码是成功的业务模型的前提。 虽然建立准确的算法和计算技能的应用是过程的一部分,但这是什么基础呢? 从自动驾驶汽车等基于AI的大规模技术革命到构建非常简单的算法,您都需要正确格式的数据。实际上 ...
2019-12-09“我都不想说什么了。我们在房山跟关禁闭似的,去建国门上个专业课得坐将近2个小时的地铁……”DT君赶紧摆了摆手拒收了艾伦的苦水。艾伦是中国社会科学院大学的研究生,当年怀揣理想来到北京,却发现自己来到了一个 ...
2019-12-09作者 | Francois Chollet 编译 | CDA数据分析师 The future of deep learning 鉴于我们对深网的工作原理,局限性以及研究现状的了解,我们能否预测中期的发展方向?这是一些纯粹的个 ...
2019-12-09作者 | Hired_HQ 来源 | 新智元 Hired发布了《2019 年度薪酬状况报告》。调查显示:仅有23%的计算机科学相关专业硕士/博士表示高学历为其带来高薪;54%从业者表示不会继续深造;40岁后薪资呈 ...
2019-12-09作者 | 罗钰靖、阿米 来源 | DT财经 数据 | 罗钰靖、李飞、吕三利 流量明星+电影≠流量电影 2019年,可谓是易烊千玺真正意义上的千禧年。在《上海堡垒》已经沦落到与《逐梦演艺圈 ...
2019-12-04作者 | 吴子劲 来源 | 网易数读 如果你想开一家公司,你会把办公室放在哪里? 北上广深自然是第一批出现在脑海的名字,杭州成都近几年也是热门;华为松山湖办公室正式 ...
2019-12-04作者 | Daniel van Flymen 来源 | Python学习开发 你是否会和我一样,对加密数字货币底层的区块链技术非常感兴趣,特别想了解他们的运行机制。 但是学习区块链技术并非一帆风顺,我看多 ...
2019-12-04作者 | 傅一平 来源 | 与数据同行 今天跟着我来学学数据仓库的基础知识,希望你结合案例可以把它吃透。 一、数据仓库建模的意义 如果把数据看作图书馆里的书,我们希望看到它们在书 ...
2019-12-03作者 | 小小挖掘机 来源 | SIGAI 主成分分析 主成分分析是一种数据降维和去除相关性的方法,它通过线性变换将向量投影到低维空间。对向量进行投影就是对向量左乘一个矩阵,得到结果向量 ...
2019-12-03作者 | 数据分析1480 来源 | lsxxx2011 (1) 无监督和有监督算法的区别? 有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。 ...
2019-12-03作者 | 小小挖掘机 来源 | SIGAI 数学 1.列举常用的最优化方法 梯度下降法 牛顿法, 拟牛顿法 坐标下降法 梯度下降法的改进型如AdaDelta,AdaGrad,Adam,NAG等。 ...
2019-12-02作者 | George Dvorsky 编译 | 深度学习这件小事 1 排序算法 所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序算法,就是如何使得记录按 ...
2019-12-02作者 | 孙煜 何苗 来源 | 数据线SJX 今年的车市不太景气。 据中国汽车工业协会数据,1-9月中国汽车产销分别完成1814.9万辆和1837.1万辆,产销量同比分别下降11.4%和10.3%。乘用车产销量 ...
2019-12-02作者 | zsx_yiyiyi 来源 | python大本营 25个Matplotlib图的汇编,在数据分析和可视化中最有用。此列表允许您使用Python的Matplotlib和Seaborn库选择要显示的可视化对象。今天给大家分享剩余 ...
2019-11-29作者 | Kevin Casey 来源 | D1Net 人工智能和大数据之间的关系是双向的。可以肯定的是:人工智能的成功很大程度上取决于高质量的数据,同时,管理大数据并从中获取价值越来越多地依靠(诸如机 ...
2019-11-29数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10