python清理数据领域的知识。 lambda 表达式是一个匿名函数,lambda表达式基于数学中的λ演算得名,直接对应于其中的lambda抽象,是一个匿名函数,即没有函数名的函数。 lambda表达式可以接受任意数量的参数 ...
2020-05-09
相信接触过Excel的小伙伴都知道,Excel有一个非常强大的功能“数据透视表”,使用数据透视表可以自由选择不同字段,用不同的聚合函数进行汇总,并建立交叉表格,用以从不同层面观察数据。这么强大的功能,在Python ...
2020-05-09
一般大家在学习python机器学习的时候,用的最多的可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互,简单来说就是matplot和se ...
2020-05-09
很多企业在营销的时候会提到“用户画像”,那用户画像究竟是什么呢? 其实用户画像就是用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出 ...
2020-05-09
矩阵分析、矩阵理论、矩阵论是三种较为常见学科,这里为大家介绍一些它们的适用范围和区别。 ——矩阵分析 主要包括线性空间与线性变换,内积空间,矩阵的相似标准形,矩阵分解,矩阵函数等内容, ...
2020-05-08
近几年,数据的增长速度呈现爆炸式趋势,数据营利成为或将成为收入的主要来源。大部分的商业智能应用均针对营销决策,在这一领域的主要影响如下。 (1)、规划分析 数据科学家为营销部门提供了对客户行为 ...
2020-05-08
BI分析几年来越来越流行,我们从最简单的概念BI入手,来诠释出BI分析就是什么? BI,英文全称为:Business Intelligence,中文翻译为商业智能。这个概念最早在1996年提出。当时将商业智能定义为一类由数 ...
2020-05-08
1984年,Light等提出了漏斗图,一般以单个研究的效应量为横坐标,样本含量为纵坐标做的散点图。效应量可以为RR、OR和死亡比或者其对数值等。理论上讲,被纳入Meta分析的各独立研究效应的点估计,在平面坐 ...
2020-05-08
Tableau是一款帮助人们查看并理解数据的软件,拥有强大、安全且灵活的端到端数据分析negligible,可以助力任何人快速分析、可视化并分享信息。在百度百科中显示,目前已有超过42,000家客户通过使用Tableau在 ...
2020-05-07
如今的维度分析方式越来越受大众的欢迎,无论是在数据分析领域,还是学习生活方面,它都能显现出闪光点。 首先,维度分析是一个比较大的范畴,涵盖的方面很多,比如一个主题的多方面,也可以是多个主体 ...
2020-05-07
R语言dplyr包主要用于数据清洗和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包,学清楚了,基本上数据能随意玩弄,对的,随意玩弄,简直大大提高数据处理及分 ...
2020-05-07
随着人工智能的飞速发展,机器学习成为当下数据分析领域的热门之一,很多人在平时的工作中,或多或少都会使用到机器学习的算法。这里机器学习的算法进行了盘点,将有监督、无监督,半监督学习等进行了简单的解 ...
2020-05-06
网上找到的有关python语音识别的例子,有一些成熟的模型,可以进行python语音识别,将语音转成文字。例如Cloud Speech API,但是需要你使用google云平台的前提。下面我们一起来看看吧! ...
2020-05-06
内置示例数据集 seaborn内置了十几个示例数据集,通过load_dataset函数可以调用。 其中包括常见的泰坦尼克、鸢尾花等经典数据集。 #查看数据集种类 importseabornassns sn ...
2020-04-28
首先先看一下效果: 一、创建饼状图对象 创建饼状图对象用到类是PieChartView.h, 代码如下: self.pieChartView = [[PieChartView alloc] init]; self.pieChartVi ...
2020-04-28
把这三个包放在一起有几个原因:首先 Seaborn 和 Pandas 是建立在 Matplotlib 之上的,当你在用 Seaborn 或 Pandas 中的 df.plot() 时,用的其实是别人用 Matplotlib 写的代码。因此,这些图在美化方面是 ...
2020-04-28
CDA数据分析师 出品 近日,新冠肺炎防控成果的好消息不断。 今天我们聊聊,惊艳的疫情直观图。 据国家卫健委数据统计, 截止至3月10日24时,31省区市累计治愈出院病历超6 ...
2020-04-28
条形图,应该也是大家非常熟悉的一种图表了。 条形图的识别度极高,用它来视觉化地传达具体数字背后的意义,干净又利落,复杂的数据到了这里,顿时变得一目了然。 现在就让 ...
2020-04-22
今天给大家分享一下如何画出漂亮的箱线图。首先,我们最简单工具画箱线图就是EXCEL,那么我们先介绍一下用EXCEL来画一下。 选中数据,然后点击下插入,选择图表,找到箱线图 ...
2020-04-22
想画SNP标记在不同的染色体的分布密度,但是不知道用什么软件画出来的?说不定在论坛发个贴就能解决你的困扰哦~ 这不,有网友发个贴提问,就有码农分享自己的代码了。小编把代码也贴出来给大家瞄 ...
2020-04-22在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09