首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在熊猫中执行等价的相关子查询

如何在熊猫中执行等价的相关子查询
EN

Stack Overflow用户
提问于 2017-04-23 18:05:11
回答 1查看 3.4K关注 0票数 5

我有一个来自卡格尔泰坦尼克号比赛的CSV文件如下。此文件的记录格式由以下列描述: PassengerId、Sex、Pclass、Name、性别、年龄、SibSp、Parch、机票、机票、船舱、登船。我想分析这个文件中的数据,并检查在一个群体中旅行的乘客是否有一个更好的存活率。对于这一点,我假设一组中的所有乘客的机票价值是相同的。

我在MS Access中加载了CSV,并执行了以下查询以获得所需的结果集:

代码语言:javascript
复制
SELECT a.Ticket, a.PassengerId, a.Survived
FROM train a
WHERE 1 < (SELECT COUNT(*) FROM train b WHERE b.Ticket = a.Ticket)
ORDER BY a.Ticket

如果不编写循环,我就无法提取与上面相同的结果集。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-23 18:32:08

让我们看看这是否匹配:

代码语言:javascript
复制
df.groupby(['Ticket']).filter(lambda x: x.Ticket.count()>1)[['Ticket','PassengerId','Survived']]

或者根据杰兹拉尔的建议:

代码语言:javascript
复制
df.groupby(['Ticket']).filter(lambda x: len(x)>1)[['Ticket','PassengerId','Survived']]

我在票证上使用groupby,然后使用filter将数据过滤到该票证组中的计数大于1的记录中。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43574675

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档