我的数据框df看起来像:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 810 entries, 0 to 809
Data columns (total 21 columns):
event_type 810 non-null object
datetime 810 non-null datetime64[ns]
person 810 non-null object
...
from_file 0 non-null float64
dtypes: datetime64[ns](1), float64(2), int64(2), object(16)
memory usage: 133.0+ KB
(有21列但只有我感兴趣的上述四列,所以我省略了它们)
我想创建一个数据帧第二df_b有两列,其中一人是组合df的event_type,person,from_file列,另一个是df的datetime。我能解释得那么好吗?...(所以df_b从df四个中的两列开始,但上面的三个列合并为一个列中df_b的一个)
我想创建一个新的数据帧df_b:
df_b = pandas.DataFrame({'event_type+person+from_file': [], 'datetime': []})
然后选择所有行:
df.loc[:, ['event_type','person','from_file','datetime']]
但除此之外,我不知道是怎么实现的其余部分,我一直在想,我要与落得datetime这不符合原始行的值,datetime这是从拉df。
所以你能告诉我如何:
选择:event_type,person,from_file,datetime从所有行d
解决办法:要删除NaN值,请使用:
df_clean = df.dropna(subset=['event_type', 'person', 'from_file'])
在Pandas中连接字符串列非常简单
df_clean['event_type+person+from_file'] = df_clean['event_type'] + '+' +
df_clean['person'] + '+' + df_clean['from_file']
然后:
df_b = df_clean[['event_type+person+from_file', 'datetime']].copy()
结合:event_type,person,from_file与'+'值之间
然后把(event_type+person+from_file),datetime放入df_b








暂无数据