文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法,主要用途 ...
2020-07-02echarts是一个使用 JavaScript 实现的开源可视化库,因为其着良好的交互性,精巧的图表设计,受到众多开发者青睐。Python 是一门富有表达力的语言,在数据处理方面很在行。当Python数据分析遇上echarts数据可视化 ...
2020-07-02seaborn是建立在Matplotlib基础之上的高级的API,是比Matplotlib更为高级的的一种python可视化库。专攻于统计可视化,有丰富的可视化库,包括一些复杂类型,如时间序列、联合分布图(jointplots)和小提琴图(violind ...
2020-07-02相信只要接触过python的人,对于matplotlib都很熟悉。matplotlib是一种python可视化库。 matplotlib 是一个用于创建二维图和图形的底层库,是python可视化库中规中矩的一种库,像大多数编程语言的标准库一 ...
2020-07-02Python是一款功能强大的数据分析工具,其中Python可视化功能更是受到许多数据分析师的青睐,下面小编就给大家分享一些Python可视化库,希望对各位数据分析师小伙伴有所帮助。 1.Matplotlib Matplotlib是一个 ...
2020-07-02“CDA数据分析师认证”是一套专业化,科学化,国际化,系统化的人才考核标准,分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ,CDA Level II:建模分析师,专指金融、电信、零售、互联网、电商、医学等行业专门从事数据分 ...
2020-07-01在许学习贝叶斯方法的时候最常见到的就是先验概率,后验概率。下面小编简单介绍一下先验概率,希望对各位小伙伴有所帮助。 一、先验概率定义 先验概率是指根据以往经验和分析得到的概率 二、先验概率条件 ...
2020-07-01今天小编给大家分享一下最小二乘法的一些内容。 一、最小二乘法概念 最小二乘法Least Square Method,做为分类回归算法的基础,有着悠久的历史(由马里·勒让德于1806年提出)。主要是通过最小化误差的平方以 ...
2020-07-01贝叶斯分类是一类分类算法的总称,这类算法都是以贝叶斯定理为基础,所以统称为贝叶斯分类。贝叶斯分类中最简单,同时也是常见的一种分类方法就是朴素贝叶斯分类。下面小编来简单介绍一下朴素贝叶斯分类。 一、 ...
2020-07-01有监督学习的主要任务是分类和回归,而其中最简单的一种回归方式就是线性回归。下面跟随小编一起来看线性回归的内容吧。 线性回归得出的模型不一定是一条直线,在只有一个变量的时候,模型是平面中的一条直线; ...
2020-07-01机器学习分为:有监督学习,无监督学习,半监督学习等。今天跟小编一起来看有监督学习的内容吧。 一、有监督学习定义 有监督学习,就是大家常说的分类,通过某种或某些特性的样本作为训练集,建立一个最优模 ...
2020-07-01相信各位统计学的小伙伴对于T分布并不陌生,T分布,即学生T-分布(Student\'st-distribution),经常被应用在对呈正态分布的总体的均值进行估计。下面小编就具体来介绍一下T分布。 一、T分布的来源 简单说一下 ...
2020-07-01异常值,又称离群点,是指那些在数据集中存在的不合理的值,需要注意的是,不合理的值是偏离正常范围的值,不是错误值。比如人的身高为-1m,人的体重为1吨等,都属于异常值的范围。虽然异常值不常出现,但是又会对 ...
2020-07-01相信做数据分析的小伙伴一定都听说过啤酒与尿布的故事,超市把有关联的东西放在一起,以方便顾客购买,这个故事体现的就是关联规则。关联规则又被称为关联分析,它的目的是在一堆事物中找出具有关联的事物。经常被 ...
2020-07-01协同过滤(CollaborativeFiltering)是推荐算法中最经典、应用最广泛的类型,主要的功能是预测和推荐。它的原理是通过了解用户与物品之间的关系进行推荐,物品本身的属性不考虑在内。主要由线的协同和离线的过滤两部 ...
2020-07-01异常值是指样本中的个别值,其数值明显偏离它(或它们们)所属样本的其余观测值。异常值分析目的是检验是否有录入错误的数据以及是否含有不合常理的数据时。如果对异常值的存在忽视不见,在数据的计算分析过程中把异 ...
2020-06-30R语言是一种用来进行数据探索、统计分析、绘图的解释型语言。它具有丰富的数据类型、以及数量众多的算法功能包、以及非常灵活多样的作图功能。是目前各行各业的数据分析师都在实使用的一种语言,受到众多企业以及 ...
2020-06-30数据倾斜是数据挖掘过程中的常见问题,尤其是在需要处理的数据量过于庞大时,我们可能会需要花费几周甚至更长时间去处理。小编今天就来跟大家分享一下数据倾斜的表现以及产生原因,希望对各位小伙伴有所帮助。 ...
2020-06-30作者:挪亚·吉夫特(Noah Gift) 来源:大数据DT(ID:hzdashuju) 内容摘编自《人工智能开发实践:云端机器学习导论》 导读:本文介绍Python中的常见控制结构。 传统Python语言的主要控制结构是for ...
2020-06-30文章来源:数据分析与统计学之美 作者:黄伟呢 1.概述 python字符串应该是python里面最重要的数据类型了,因此学会怎么处理各种各样的字符串,显得尤为重要。 我们不仅要学会怎么处理单个字符串, ...
2020-06-30CDA 数据分析师报考条件全解析:开启数据洞察之旅 在当今数字化浪潮席卷全球的时代,数据已成为企业乃至整个社会发展的核心驱 ...
2025-07-01深入解析 SQL 中 CASE 语句条件的执行顺序 在 SQL 编程领域,CASE语句是实现条件逻辑判断、数据转换与分类的重要工 ...
2025-07-01SPSS 中计算三个变量交集的详细指南 在数据分析领域,挖掘变量之间的潜在关系是获取有价值信息的关键步骤。当我们需要探究 ...
2025-07-01CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26CDA 数据分析师会被 AI 取代吗? 在当今数字化时代,数据的重要性日益凸显,数据分析师成为了众多企业不可或缺的角色 ...
2025-06-26CDA 数据分析师证书考取全攻略 在数字化浪潮汹涌的当下,数据已成为企业乃至整个社会发展的核心驱动力。数据分析师作 ...
2025-06-25人工智能在数据分析的应用场景 在数字化浪潮席卷全球的当下,数据以前所未有的速度增长,传统的数据分析方法逐渐难以满足海 ...
2025-06-25评估模型预测为正时的准确性 在机器学习与数据科学领域,模型预测的准确性是衡量其性能优劣的核心指标。尤其是当模型预测结 ...
2025-06-25CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-06-24金融行业的大数据变革:五大应用案例深度解析 在数字化浪潮中,金融行业正经历着深刻的变革,大数据技术的广泛应用 ...
2025-06-24Power Query 中实现移动加权平均的详细指南 在数据分析和处理中,移动加权平均是一种非常有用的计算方法,它能够根据不同数据 ...
2025-06-24数据驱动营销革命:解析数据分析在网络营销中的核心作用 在数字经济蓬勃发展的当下,网络营销已成为企业触达消费者 ...
2025-06-23随机森林模型与 OPLS-DA 的优缺点深度剖析 在数据分析与机器学习领域,随机森林模型与 OPLS-DA(正交偏最小二乘法判 ...
2025-06-23