作者:小伍哥 来源:小伍哥聊风控 大家好,我是小伍哥。 有效的风险感知或者无监督风险识别,其实非常的难,很多同学甚至无法下手,做了的可能也没有效果,如果找到合适的方法了,其实是非常有意思, ...
2022-04-06
2020年是特殊的一年,突如其来的疫情,阻断了全球经济高速发展的步伐,很多城市经济陷入低迷。同样,对很多人而言,2020年亦是充满机遇的一年。 古有云:时势造英雄。在遭遇重大危机时,安于现状者无法独善其身 ...
2022-04-03人力资源和社会保障部发布《新职业—大数据工程技术人员就业景气现状分析报告》,显示2020年中国大数据行业人才需求规模预计将达210万,未来5年需求仍将保持30%-40%的增速,需求总量在2000万人左右。 图片 ...
2022-04-03
「A+」优秀的产品很难表达,但...如你所见 A+的“+号”亦为“十字”,从IT到DT再到未来的智能时代,人才的进步也从“1”字型人才到“T”字型人才再进化到“十”字型人才。所谓“1”字型人才是指具备某个领域的 ...
2022-04-03
关于CDA A+学位课程的问题,看这一篇就够了 A+的“+号”亦为“十字”,从IT到DT再到未来的智能时代,人才的进步也从“1”字型人才到“T”字型人才再进化到“十”字型人才。 所谓“1”字型人才是指具备 ...
2022-04-03
作者:麦叔 来源:麦叔编程 引子 今年开始,我在翻译一本大部头的,比较经典的的Python进阶书籍。 有空就翻译几页。这本书不仅是教你很多进阶的Python的语法,更重要的是讲解很多设计方法和设计思 ...
2022-04-02
作者:麦叔 来源:麦叔编程 ❝ 学过其他编程语言的同学肯定发现了我们Python语言中竟然没有"很常见"的switch/case关键字,更别提对应的语法结构了。既然没有,有些时候又需要用,那只能自己写一个" ...
2022-04-02
CDA数据分析师 出品 编辑:Mika 在用户行为分析的过程中,我们需要更细致的衡量指标,这样才更有利于我们准确预测产品发展的走向,并通过版本迭代及时对产品进行优化和改进。 同期群分析最早用 ...
2022-04-01
作者: 俊欣 来源:关于数据分析与可视化 对于机器学习爱好者而言,很多时候我们需要将建好的模型部署在线上,实现前后端的交互,今天小编就通过Flask以及Streamlit这两个框架实现机器学习模型的前后端交互 ...
2022-04-01
CDA数据分析师 出品 作者:曹鑫 编辑:Mika 在 Python 语言中,datetime模块可以获取到不同的时间和日期。 那么,具体该如何操作呢?今天我们就跟大家一起 ...
2022-03-30
作者:Kevin 来源:麦叔编程 ❝ 081篇,讲解了@property和@staticmethod的用法,有看官就表示@staticmethod都说了为什么不把@classmethod也拿出来说说?今天的三分钟就专门讲解下@classmethod ...
2022-03-29
作者:丁点helper 来源:丁点帮你 上篇文章介绍了如何在数据中增加或者删除变量,但是实际操作中,我们需要从大的数据库中选取一些变量来分析,那么如何从数据中选取多个变量呢? ...
2022-03-29
作者:Python进阶者 来源:Python爬虫与数据挖掘 前言 大家好,我是黑脸怪。之前给大家分享过拼叨叨的逆向,今天给大家分享数美滑块。 其实这个问题,之前在Python黄金群也有问过【十一姐】,当时 ...
2022-03-28
作者:俊欣 来源:关于数据分析与可视化 今天小编总结归纳了若干个常用的可视化图表,并且通过调用plotly、matplotlib、altair、bokeh和seaborn等模块来分别绘制这些常用的可 ...
2022-03-28
作者:Kevin 来源:麦叔编程 @property @property装饰器可以把类中的实例方法转成一个“值”,上代码: class Circle: def __init__(self, dia): self.dia = dia ...
2022-03-25
作者:俊欣 来源:关于数据分析与可视化 今天我们来聊一下如何用协程来进行数据的抓取,协程又称为是微线程,也被称为是用户级线程,在单线程的情况下完成多任务,多个任务按照一定顺序交替执行。 那么ai ...
2022-03-24
作者:小伍哥 来源:小伍哥聊风控 大家好,我是小伍哥,今天跟大家聊个比较深入点的话题,技术好就能做好风控么? 风控算法或风控策略,确实需要很深、很广泛的技术储备,但是也需要很高的应用艺术和想象 ...
2022-03-24
CDA数据分析师 出品 作者:CDA资深讲师 张藉予 编辑:Mika 随着数据分析的不断应用与发展,用户画像已经广为人知。其中的核心原理就是对用户进行分群,而用户分群的主要逻辑就是将数据进行标签化。 ...
2022-03-22在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05