最近python这么火,大家是不是也都在用啊。对于小编这种小白来说,对于python的一切都很迷茫,又很好奇,这不就看见了这样一篇文章:当python 中混进一只薛定谔的猫……为此,小编还专门去问了度娘python和薛定谔 ...
2020-07-31小编以前简单跟大家分享过方差分析。先来回顾一下概念:方差分析(ANOVA)又称“变异数分析”或“F检验”,是由罗纳德·费雪爵士发明的,用于两个及两个以上样本均数差别的显著性检验。但是对于方差分析更深层次的 ...
2020-07-31CDA数据分析师 出品 作者:泽龙、Mika 数据:真达 后期:泽龙 【导读】 密室大逃脱还是鬼屋大逃脱?今天我们用数据来盘一盘《密室大逃脱2》。 Show me data,用数据说话 今天我们 ...
2020-07-31在python数据清洗过程中,我们经常会遇到一些偏离正常范围的数据,例如人的体重为56吨,这些数据叫做异常值,如果不做异常值处理,会对我们最终的数据分析造成影响。小编今天给大家带来了一种很实用的异常值处理方 ...
2020-07-31提到噪声,你会想到什么?刺耳的,高分贝的声音?总之就是不好的,不想接受的声音。小编今天跟大家分享的就是python数据清洗中的噪声数据,对于这些噪声数据我们应该怎样检测和处理呢?下面跟小编一起来看吧。 一 ...
2020-07-31散点图大家都能绘制,平常工作汇报有时也会用散点图让报表看起来更美观。但是,散点图并不是为了展示数据,而是需要数据分析,并利用数据分析的结果推动业务的增长。小编今天跟大家分享的这篇文章就是教大家 ...
2020-07-30今天小编给大家分享的文章是:为什么我们的神经网络需要激活函数。神经网络是机器学习里极为重要的一门技术。学习神经网络不仅能让让我们掌握一门强大的机器学习方法,还有利于我们理解深度学习技术。希望通过这篇 ...
2020-07-30今天跟大家介绍的是SVM算法原理以及实现,废话不多说,直接来看干货吧! 一、SVM概念 SVM的全称为Support Vector Machine,也就是我们经常提到的支持向量机,主要被用来解决模式识别领域中的数据分类问题,是 ...
2020-07-30损失函数,loss function的定义为:将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在机器学习中,损失函数经常被当作学习准则与优化问题相联系,也就是通过最小化 ...
2020-07-30对于python,平常工作中大家最经常用到的就是它的可视化功能了。python有许多功能强大的可视化库,例如Matplotlib、Pyecharts、Seaborn、Plotly、Bokeh,大家一定不陌生,但是对于这五种可视化库的区别,以及什么 ...
2020-07-29CDA数据分析师 出品 作者:Mika 数据:真达 后期:泽龙 【导读】 随着自热食品越来越备受消费者的追捧,各种自热小火锅、自热米饭也成了妥妥的网红食品。我们今天就来聊一聊自热食品 ...
2020-07-29想必大家在学习数据分析的时候,一定接触过ETL,那么关于ETL大家了解到什么程度呢?跟小编一起来复盘一下吧! 一、ETL概念 ETL全称是:Extract-Transform-Load,是将业务系统的数据经过抽取(Extract)、清洗转 ...
2020-07-29对于一些像小编一样零基础学习数据分析的人来说,入门阶段很容易迷茫,也最容易放弃的阶段,会被各种概念搞得七荤八素。就拿SQL来说,就简单的,我们知道SQL 是用于访问和处理数据库的标准的计算机语言。可后来又 ...
2020-07-29经常听到大家在讨论D3怎么怎么样,小编还很好奇D3是什么,今天终于了解到了。下面小编就带大家一起来看,到底什么是D3.用它能做什么吧。 一、D3概念 D3 的全称为:Data-Driven Documents,实质上就是一 ...
2020-07-29文章来源:早起Python微信公众号 作者:陈熹 前言 在我们写爬虫的过程中,目标网站常见的干扰手段就是设置验证码等,本就将基于Selenium实战讲解如何处理弹窗和验证码,爬取的目标网站为某仪器预约平台 ...
2020-07-29文章来源:Python猫 作者:豌豆花下猫 关于 python 中的pass语句,它似乎很简单(只有 4 个字母),即使是没有任何编程经验的初学者也能很快地掌握它的用法。 官方文档 的介绍十分简单,下面的三个 ...
2020-07-29假设检验问题是统计推断中的一类重要问题,小编在之前给大家整理,分享过假设检验的基本步骤,今天给大家带来的是常见的假设检验方法,希望对大家有所帮助。 一、假设检验基本概念 假设检验是用来判断样本与 ...
2020-07-28通常来说,计算机对于网络上存在的大量半结构化或结构化的文本数据,计算机很难直接进行处理,因此我们需要在文本分类之前对这些数据作相应的预处理。文本的预处理分为:文本分词、去除停用词、词义消歧、统计等处 ...
2020-07-28CDA数据分析师 出品 作者:Mika 数据:真达 后期:泽龙 【导读】 最近《三十而已》这部剧频频霸占微博热搜,今天我们就来聊一聊。 Python技术部分请直接看第四部分。 Show me data ...
2020-07-28小编最近在网上下载了一批素材图片需要批量裁剪,这可难住小编了,一张张来做的话,那可得弄到猴年马月了。这时有小伙伴给推荐了一款神器:OpenCV。据说小伙伴说,他们做图像处理,经常会需要大批量的修改图片尺寸 ...
2020-07-27在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15