热线电话:13121318867

登录
2019-02-25 阅读量: 787
如何组合数据框列

我的数据框df看起来像:

<class 'pandas.core.frame.DataFrame'>

RangeIndex: 810 entries, 0 to 809

Data columns (total 21 columns):

event_type 810 non-null object

datetime 810 non-null datetime64[ns]

person 810 non-null object

...

from_file 0 non-null float64

dtypes: datetime64[ns](1), float64(2), int64(2), object(16)

memory usage: 133.0+ KB

(有21列但只有我感兴趣的上述四列,所以我省略了它们)

我想创建一个数据帧第二df_b有两列,其中一人是组合df的event_type,person,from_file列,另一个是df的datetime。我能解释得那么好吗?...(所以df_b从df四个中的两列开始,但上面的三个列合并为一个列中df_b的一个)

我想创建一个新的数据帧df_b:

df_b = pandas.DataFrame({'event_type+person+from_file': [], 'datetime': []})

然后选择所有行:

df.loc[:, ['event_type','person','from_file','datetime']]

但除此之外,我不知道是怎么实现的其余部分,我一直在想,我要与落得datetime这不符合原始行的值,datetime这是从拉df。

所以你能告诉我如何:

选择:event_type,person,from_file,datetime从所有行d

解决办法:要删除NaN值,请使用:

df_clean = df.dropna(subset=['event_type', 'person', 'from_file'])

在Pandas中连接字符串列非常简单

df_clean['event_type+person+from_file'] = df_clean['event_type'] + '+' +

df_clean['person'] + '+' + df_clean['from_file']

然后:

df_b = df_clean[['event_type+person+from_file', 'datetime']].copy()

结合:event_type,person,from_file与'+'值之间

然后把(event_type+person+from_file),datetime放入df_b

0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子