merage#

pandas提供了一个类似于关系数据库的连接(join)操作的方法merage,可以根据一个或多个键将不同DataFrame中的行连接起来，语法如下：

123	`merge(left, right, how='inner', on=None, left_on=None, right_on=None,` `left_index=False, right_index=False, sort=True,` `suffixes=('_x',` `'_y'), copy=True, indicator=False)`

作为一个功能完善、强大的语言，python的pandas库中的merge()支持各种内外连接。

sql中的

1234567 SELECT *FROM df1INNER JOIN df2 ON df1.key = df2.key;或SELECT *FROM df1,df2 where df1.key=df2.key

pandas中用：

1	`pd.merge(df1, df2, on='key')`

然后就是各种外连接了：

1	`pd.merge(df1, df2,` `on='key', how='left')`

how变成left/right。全链接outer。

join方法提供了一个简便的方法用于将两个DataFrame中的不同的列索引合并成为一个DataFrame。

其中参数的意义与merge方法基本相同,只是join方法默认为左外连接how=left。

还有一种连接方式：concat

concat方法相当于数据库中的全连接(UNION ALL),可以指定按某个轴进行连接,也可以指定连接的方式join(outer,inner 只有这两种)。

与数据库不同的是concat不会去重，要达到去重的效果可以使用drop_duplicates方法

12	`concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,` `keys=None, levels=None, names=None, verify_integrity=False, copy=True):`

49.7595

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子