啊啊啊啊啊吖

使用pandas为什么`DataFrame(foo)

从示例开始...... In [1]: import pandas as pd In [2]: from sklearn.datasets import load_iris In [3]: iris = load_iris() In [4]: X = pd.DataFrame(data=iris.data, columns=iris.feature_names) In [5]: outp

啊啊啊啊啊吖

2019-03-14

11.0571 1 3
  • 关注作者
  • 收藏

如何将零向量添加到Pandas DataFrame?

我有一个pandas变量X具有shape的(14931, 381)。 这是14,931个示例,每个示例都有381个功能。我想为每个示例添加483个功能(每个都有一个零值),除了我希望它们在381个现有功能之前 如何才能做到这一点? 解决办法:创建一个零和调用的DataFrame pd.concat。 v = pd.DataFrame(0, index=df.index, columns=ra

啊啊啊啊啊吖

2019-03-14

19.6350 2 1
  • 关注作者
  • 收藏

计算之间的Pearson成对相关性

我将单热编码应用于我的数据集中的分类特征,现在我被要求计算并可视化所有特征之间的Pearson成对相关性。虽然,在编码之后,对于分类特征的每个值存在更多列,并且计算它们之间的相关性是没有意义的。 corr = df.corr(method='pearson') sns.heatmap(corr) 我该如何解决这个问题? a 解决办法:Pearson Correlation的定义,就说: “P

啊啊啊啊啊吖

2019-03-14

11.0571 1 1
  • 关注作者
  • 收藏

DataFrame中read_excel中的多个索引

如果之前已经问过这个问题。我做了一些研究,仍然无法使我的代码正常工作。 我正在尝试将excel文件读入数据帧。 Excel文件 - Book1 import numpy as np import pandas as pd import io file1 = "Book1.xlsx" Infile = pd.read_excel(file1,Sheet_Name = 'Sheet6',inde

啊啊啊啊啊吖

2019-03-14

0.0000 0 0
  • 关注作者
  • 收藏

如何在Pandas中使用Apply函数应用/ lambda?

我有两个数据集: df5 = pd.DataFrame({"id":[1,2,3,4,5]}) df6 = pd.DataFrame({"ID":[1,2,3,4,5] ,"Name":["Tom","Dick","Harry","Mike","Sam"]}) 我想使用apply或lambda apply将df5中的id替换为df6中的实际名称。我尝试过以下方法: def extract_na

啊啊啊啊啊吖

2019-03-14

8.5779 1 2
  • 关注作者
  • 收藏

将Pandas Dataframe转换为numpy数组

啊啊啊啊啊吖

2019-03-14

0.0000 0 0
  • 关注作者
  • 收藏

如何通过python中的pandas更改CSV文件中的索引?

我正在尝试将“ID”作为索引,它会抛出下面提到的错误并且图像: a obj= pd.read_csv("Supermarkets.csv") obj ID Address City Country Name Number 0 1 Ecity-1 Bangalore India village mart 2 1 2

啊啊啊啊啊吖

2019-03-14

0.0000 0 6
  • 关注作者
  • 收藏

将一个对象数组转换为一个没有循环的数据帧

啊啊啊啊啊吖

2019-03-14

0.0000 0 0
  • 关注作者
  • 收藏

loc [index,col]和.loc [index]

假设我有一个这样的数据帧,带有“密集”的第一列和“稀疏”的第二列: # python 3.7.1, pandas 0.23.4. import pandas as pd df = pd.DataFrame({'col1':range(1,5), 'col2': [5, '', 7, '']}) missing_values_index = df[df['col2'] == ''].index

啊啊啊啊啊吖

2019-03-14

0.0000 0 4
  • 关注作者
  • 收藏

无法更改pandas数据中的列名

我有一个python字典,如下所示: d = {'comp_1': {'property_4': 24, 'property_2': 45, 'property_3': 124, 'missing': 39, 'property_1': 16}, 'comp_2': {'property_4': 23, 'property_2': 49, 'property_3': 126, 'proper

啊啊啊啊啊吖

2019-03-14

0.0000 0 3
  • 关注作者
  • 收藏

在特定值之前选择行的子集的Pandas发生在另一列中

我希望在列Y,groupby列X中出现值之前从我的数据框中提取行的子集。 例如,在这种情况下,对于X中的每个唯一值,我想在Y中出现'1'之前提取所有行,并且输出应该包括遇到第一个'1'的行。 X Y Z index 0 A 0 56 1 A 0 67 2 A

啊啊啊啊啊吖

2019-03-14

0.0000 0 2
  • 关注作者
  • 收藏

将分类变量绘制为堆积条形图

我有一个Pandas数据框,如下所示: 目的LoanStatus 商业贷款0 商业贷款1 买房子0 买房子1 商业贷款1 买车0 买房子0 婚礼1 商业贷款0 我正在尝试制作一个堆积条形图,每个类别为X轴,计数为0和1作为它们的两个堆栈。 我该怎么做呢?我是否必须为每个类别进行手动计数,还是有更聪明的方法来执行此操作? 解决办法:使用: pd.cros

啊啊啊啊啊吖

2019-03-14

0.0000 0 2
  • 关注作者
  • 收藏

如何在列pandas dataframe中连接列表的字符串值

我有一个数据帧: id val 0 a ['word1', 'word2'] 1 b ['word3','word4','word5'] 2 c ['word6', 'word6','word7'] 我怎样才能得到这样的数据帧: id val 0 a word1 word2 1 b word3 word4

啊啊啊啊啊吖

2019-03-14

0.0000 0 6
  • 关注作者
  • 收藏

建立带有map和lambda的dicts列表运行速度非常慢

我在列表中有标题名称,现在,为了构建add_table函数的dicts列表,我使用 headers = list( map( lambda x : { 'header' : x } , cols ) ) 这个似乎没有很好的扩展 - 有18000个条目,它需要大约10分钟。 任何见解/改进都是超级的。谢谢! 解决办法:要创建像这样的对象: [{'header': 'A'}, {'head

啊啊啊啊啊吖

2019-03-14

0.0000 0 2
  • 关注作者
  • 收藏

“未进入”未输出预期值

我觉得这是一个白痴问这个,但我有一个主列表和2个列表,其中包含主列表中的条目。我想制作第三个列表,其中包含主列表中的其余条目。但由于某种原因,我的for循环只输出列表中的每个条目,而忽略if语句。知道为什么吗?这是我第一次使用1个衬垫和if语句,但我尝试使用常规语法,但它仍然无效。 from sklearn import preprocessing, linear_model, svm from

啊啊啊啊啊吖

2019-03-14

0.0000 0 1
  • 关注作者
  • 收藏

如果不满足条件,则丢弃整个组

我有一个pandas数据帧如下: df = pd.DataFrame({'alpha':['a','a','b','b'],'beta':[1,2,3,4]}) a 我们的想法是只返回列中满足某些条件的组beta,否则丢弃整个组 我想要的结果是: a 解决办法:可以使用groupby.filter如下: print (df.groupby('alpha').filter(lambda x

啊啊啊啊啊吖

2019-03-14

0.0000 0 4
  • 关注作者
  • 收藏

使用子节点创建具有相同名称的多个节点

我有一个文本文件,我用python使用xml.etree.cElementTree库解析它。在输入中我有一个

包含句子的段落,每个句子都有单词,这里是文本文件的样子: This is my first sentence. This is my second sentence. 在输出中我想有以下xml文件:

this

啊啊啊啊啊吖

2019-03-12

7.6719 1 1
  • 关注作者
  • 收藏

Pandas数据帧输出错误的计算

这是股票的每日回报,我将数据存储在名为simple_return的数据框中。 15.3238 15.2006 15.1595 15.1184 15.0773 我执行以下代码: simple_return = simple_return/simple_return.shift(1) - 1 当我这样做时,我得到以下输出: 1 nan -0.3419843641916497 -0.9511866

啊啊啊啊啊吖

2019-03-12

7.6719 1 1
  • 关注作者
  • 收藏

一种使用字典对列表中的整数进行排序的方法

我想知道是否有一种方法可以根据增加的浮点数作为字典中的值按顺序对列表进行排序。我真的不知道怎么解释它所以我会证明我的意思 [3, 6, 4] 至 [6, 4, 3] 像这样的字典 {6: 15.6, 3: 120.0, 4: 17.3} 解决办法:使用sorted的key参数: >>> mylist = [3, 6, 4] >>> mydict = {6:15.6, 3:120.0, 4:

啊啊啊啊啊吖

2019-03-12

7.6719 1 4
  • 关注作者
  • 收藏

如何检查是否所有元素元素都填充在Python中

我正在使用数组或列表在Python中创建待办事项列表应用程序。我想检查包含所有“待办事项”的数组是否已满。如果它已满,我会通知用户该列表已满。我还是个初学者。 todo_list = ["1.)", "2.)", "3.)", "4.)", "5.)", "6.)", "7.)", "8.)", "9.)", "10.)"] def addTask(taskName): ''' thi

啊啊啊啊啊吖

2019-03-12

17.1228 2 0
  • 关注作者
  • 收藏
<123453>