首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >pandas合并两个没有重复行的数据帧

pandas合并两个没有重复行的数据帧
EN

Stack Overflow用户
提问于 2021-02-20 00:41:07
回答 1查看 37关注 0票数 0

我有两个数据帧:

代码语言:javascript
复制
test1 = pd.DataFrame({'Gene':['WASH7P', 'WASH7P', 'VCZ'], 'TPM':[10.034, 0.234000, 2.345]})
test2 = pd.DataFrame({'Gene':['WASH7P', 'WASH7P', 'btt'], 'TPM':[1.12345, 2.300, 0.00000]})

我想将它们合并到一个数据帧中。我试过了:

代码语言:javascript
复制
df = pd.merge(test1,test2, on = ['Gene'],how = 'outer')

结果是:

代码语言:javascript
复制
    Gene    TPM_x   TPM_y
0   WASH7P  10.034  1.12345
1   WASH7P  10.034  2.30000
2   WASH7P  0.234   1.12345
3   WASH7P  0.234   2.30000
4   VCZ     2.345   NaN
5   btt     NaN     0.00000

但是,也有重复的行。我尝试过drop_duplicates(),但这不起作用。实际数据帧要大得多,具有> 30,000行。

所需的输出:

代码语言:javascript
复制
    Gene    TPM_x   TPM_y
    WASH7P  10.034  1.12345
    WASH7P  0.234   2.30000
    VCZ     2.345   NaN
    btt     NaN     0.00000

任何帮助都是最好的。

EN

回答 1

Stack Overflow用户

发布于 2021-02-20 00:47:45

如果您正在尝试删除基于列"TPM_x“的重复项

使用这个

代码语言:javascript
复制
df = pd.merge(test1,test2, on = ['Gene'],how = 'outer').drop_duplicates(keep="first", subset = 'TPM_x')
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66281579

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档