我有两个数据集,一个具有来自两个其他数据集(A和B)的成对比较,一个具有来自这两个其他数据集的行,但也有一个表示这些行的组ID,它们具有相似的数据,并且已经被分组在一起。
成对比较df如下所示:
origin_x | id_x | origin_y | id_y | ...
__________________________________________________
A | 13 | B | 7 | ...
A | 2 | B | 5 | ...分组dataframe如下所示:
origin | id | group_id | ...
_____________________________________
A | 13 | A_13 | ...
B | 7 | A_13 | ...我想要检查成对比较数据中的某些行是否存在于分组dataframe中的同一组中。因此,如果每个成对行表示2条记录(1条来自数据集A,1条来自dataset B)之间的关系,我希望检查分组数据中的1组(具有相同的group_id)中是否存在这两条记录。
验证这一点的最好方法是什么?
发布于 2022-08-02 01:13:55
当您对数据文件进行.merge()时,一定要指定how='left'外部联接。注意,结果中的None组ID是如何表示对之间不匹配的。
https://stackoverflow.com/questions/73200803
复制相似问题