数据分析师-数据科学专业问答社区-CDA答疑社区

热线电话：13121318867

登录

PGC123

mysql left join 右表数据不唯一的情况解决方法

如果B表符合条件的记录数大于1条，就会出现1:n的情况，这样left join后的结果，记录数会多于A表的记录数。例如：A与B表的结构如下，A记录会员信息，B记录会员每日的登入记录。A表的id与B表的uid是对应关系。A 表idusername1fdipzone2terryB 表iduidlogindate112015-01-01222015-01-013

0.0000

0

6

0

关注作者

收藏

PGC123

python常见报错信息解读

在运行或编写一个程序时常会遇到错误异常，这时python会给你一个错误提示类名，告诉出现了什么样的问题，解决程序上的问题是非常有帮助的。python常见错误类型：AttributeError：属性错误，特性引用和赋值失败时会引发属性错误NameError：试图访问的变量名不存在SyntaxError：语法错误，代码形式错误Exception：所有异常的基类，因为所有python异常类都是

0.0000

0

2

0

关注作者

收藏

PGC123

DataFrame()参数解析

dataframe的参数都是什么含义呢？DataFrame()函数定义：pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)参数解析data:数据为numpy的ndarray数组或者字典或者dataframeindex:data的索引值columns:data的列名称dtype:读入后

0.0000

0

2

0

关注作者

收藏

PGC123

pandas 读取excel

pandas 如何读取excel文件？pandas 读取excel文件使用 read_excel()函数read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None,names=None, parse_cols=None, parse_dates=False,date_parser=Non

0.0000

0

1

0

关注作者

收藏

PGC123

pandas read_csv（）函数应用

pandas read_csv（）函数都有哪些参数？怎么使用pandas是种很便捷的数据处理工具，有很多高级的函数让我们高效的利用python做数据分析相关工作。pandas可以读取多种数据源，常见的一种是csv文件。pandas读取csv文件的函数是read_csv(),名字很好记。read_csv()函数有许多的参数，官网文档中函数定义如下：pd.read_csv(filepath

0.0000

0

2

0

关注作者

收藏

PGC123

pandas 制作透视表？

pandas 如何对数据做透视呢？透视表不仅仅可以由Excel等工具可以做，也可以用pandas来做。这里使用泰坦尼克号生存数据演示一下pandas如何做透视表。1、使用groupby（）函数#导入工具包import numpy as npimport pandas as pdimport seaborn as sns#下载数据titanic = sns.load_dataset(

0.0000

0

2

0

关注作者

收藏

PGC123

基本图表使用场景？

数据可视化中选择图形有什么需要注意的？基本图表使用场景是啥？柱形图：横轴可以是时间可以是不同种类数据，主要用作对比条形图：多个分类的比较。折线图：不同时间的变化趋势饼图：整体中各个分类的占比散点图：两变量之间的分布及相关性分析雷达图：多重数据间的比较

0.0000

0

1

0

关注作者

收藏

PGC123

numpy如何实现快速排序？

快速排序（Quicksort）是对冒泡排序的一种改进。基本思想是：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。numpy 中也实现了快速排序算法，可以对数据进行快速排序。numpy.sort(a, axis=-1, kind='quick

0.0000

0

0

0

关注作者

收藏

PGC123

numpy where函数返回的是啥？

numpy的where函数用法：#语法where(condition, [x, y])#condition :条件表达式#x,y :可选参数，如果有x那么也要有y.当没有x与y参数时，函数返回符合条件元素的坐标当有x与y时，条件表达式为True的元素返回x,条件表达式为False的元素返回y例如import numpy as npa = np.array(range(27))

0.0000

0

1

0

关注作者

收藏

PGC123

dataframe applymap用法？

DataFrame中的applymap()用法：调用函数对单个数据做相应的运算，返回类型是DataFrame类型。import numpy as npimport pandas as pddf = pd.DataFrame(np.random.randn(3,4),columns=list('abcd'),index=list('ABC'))df df.applymap(lamb

0.0000

0

0

0

关注作者

收藏

PGC123

dataframe apply函数使用

DataFrame的apply方法可以实现将函数应用到由各列或行形成的一维数组上的功能，具体用法看如下代码import numpy as npimport pandas as pddf = pd.DataFrame(np.random.randn(3,4),columns=list('abcd'),index=list('ABC'))df df.apply(lambda x :

0.0000

0

3

0

关注作者

收藏

PGC123

dataframe map函数应用

map是pandas中一个重要的函数，map()主要是作用将函数作用于一个Series的每一个元素，具体用法如下所示：import numpy as npimport pandas as pddf = pd.DataFrame(np.random.randn(3,4),columns=list('abcd'),index=list('ABC'))df df.a.map(lambda

0.0000

0

4

0

关注作者

收藏

阿抽哥哥

列表、字典与numpy、pandas数据类型间转换关系为何？

首先介绍下数据类型：列表：list是Python的数据类型字典：dict是Python的数据类型numpy：ndarray是numpy的数据类型pandas：series与dataframe是pandas的数据类型接下来以代码形式做介绍：from IPython.core.interactiveshell import InteractiveShellInteractiveShel

114.3933

1

4

0

关注作者

收藏

啊啊啊啊啊吖

齐全！关于R学习的书籍推荐

1.初级入门《An Introduction to R》，这是官方的入门小册子。其有中文版，由丁国徽翻译，译名为《R导论》。《R4Beginners》，这本小册子有中文版应该叫《R入门》。除此之外，还可以去读刘思喆的《153分钟学会R》。这本书收集了R初学者提问频率最高的153个问题。为什么叫153分钟呢？因为最初作者写了153个问题，阅读一个问题花费1分钟时间，全局下来也就是153分钟了。有了

0.0000

0

6

0

关注作者

收藏

啊啊啊啊啊吖

ma模型的预测公式问题

fit=arima(LakeHuron,order=c(0,0,2))fitpredict(fit,n.ahead=2)ma(2)模型的预测值是如何计算得出的？原始序列的最后三个值是：x(1970)=579.31x(1971)=579.89x(1972)=579.96我们要看模型残差。> x x[98]*1.0174 x[97]*0.5

0.0000

0

3

0

关注作者

收藏

啊啊啊啊啊吖

几行代码告诉你的R有多少包

pks % glimpsepkm % str_split("", simplify = T)pkm[, 1] %>% str_to_lower %>% table %>% sort(decreasing = T) %>% barchart(horiz

0.0000

0

3

0

关注作者

收藏

啊啊啊啊啊吖

LDA主题模型分析学习分享

最近在学习关于LDA模型的知识，做一些细粒度观点挖掘。在学习过程中发现原来R中还有一个专门的LDA包。我用LDA为两个文本文档建立了一个主题模型，分别是a和B。文档a与计算机科学高度相关，文档B与地球科学高度相关。然后我用这个命令训练lda。text

0.0000

0

2

0

关注作者

收藏

啊啊啊啊啊吖

数据挖掘，你该明白的这几点

商业和生活中，我们处处能够看到数据挖掘的影子：Target 百货分析16岁的少女买无香型沐浴露之后，判断她怀孕了；语言学家通过记录自己孩子出生到3岁每天每秒钟的状态数据，发现语言记忆和周遭环境相关性更大；调查局通过数据分析和挖掘发现改善公共环境有助于降低犯罪率。今天我们将从以下几个方面来揭开数据挖掘的神秘面纱。数据挖掘涉及的学科？a首先我们可以看出，数据分析与挖掘位于中间，

0.0000

0

4

0

关注作者

收藏

啊啊啊啊啊吖

小老弟，客户关系管理是怎么回事

在商业数据分析领域，产品的设计需要从用户的需求出发，及时反馈和改进产品质量；运营中的拉新、促活、转化和留存都是围绕和针对用户；销售人员需要先了解客户的需求再有针对性的推荐相应的产品和服务。由此可见，对客户价值的预测和管理越来越成为企业管理和发展的重要驱动力。以往大多数企业对客户的管理和分群都是基于工作日常的经验和总结。然而，在一个月黑风高的晚上，客户关系管理遇上了数据…他们的概念是：什么是

0.0000

0

4

0

关注作者

收藏

啊啊啊啊啊吖

商业分析，我用R

商业智能时代已经全面到来，分析型人才的岗位数量在就业市场中呈现井喷式的增长。无论从事产品研发的工程师，还是从事产品推广的市场人员、人力资源的财务会计人员，都需要掌握数据分析技术，否则很有可能被人工智能时代替代。“工欲善其事，必先利其器”。当前，R和Python等开源软件方兴未艾，但是这类软件学习曲线缓慢，使很多初学者的热情在进入数据分析的核心领域之前就消失殆尽。而商业数据分析的真正目的是为了解

0.0000

0

2

0

关注作者

收藏

<1…302303304…340>

CDA考试动态

CDA报考指南