如何组合数据框列

啊啊啊啊啊吖

2019-02-25 阅读量: 969

如何组合数据框列

我的数据框df看起来像：

RangeIndex: 810 entries, 0 to 809

Data columns (total 21 columns):

event_type 810 non-null object

datetime 810 non-null datetime64[ns]

person 810 non-null object

...

from_file 0 non-null float64

dtypes: datetime64[ns](1), float64(2), int64(2), object(16)

memory usage: 133.0+ KB

（有21列但只有我感兴趣的上述四列，所以我省略了它们）

我想创建一个数据帧第二df_b有两列，其中一人是组合df的event_type,person,from_file列，另一个是df的datetime。我能解释得那么好吗？...（所以df_b从df四个中的两列开始，但上面的三个列合并为一个列中df_b的一个）

我想创建一个新的数据帧df_b：

df_b = pandas.DataFrame({'event_type+person+from_file': [], 'datetime': []})

然后选择所有行：

df.loc[:, ['event_type','person','from_file','datetime']]

但除此之外，我不知道是怎么实现的其余部分，我一直在想，我要与落得datetime这不符合原始行的值，datetime这是从拉df。

所以你能告诉我如何：

选择：event_type，person，from_file，datetime从所有行d

解决办法：要删除NaN值，请使用：

df_clean = df.dropna(subset=['event_type', 'person', 'from_file'])

在Pandas中连接字符串列非常简单

df_clean['event_type+person+from_file'] = df_clean['event_type'] + '+' +

df_clean['person'] + '+' + df_clean['from_file']

然后：

df_b = df_clean[['event_type+person+from_file', 'datetime']].copy()

结合：event_type，person，from_file与'+'值之间

然后把（event_type+person+from_file），datetime放入df_b

0.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子