我有一个包含多个列(8-10)的数据帧,其中一个这样的列是year列。我还有另一个列,称为到达列。年份列由3年-2018、2019和2020年的数据组成。我想知道2019年的游客总数。我认为这将是非常基本的,但我没有得到正确的结果!有人能告诉我怎么做吗?
我听说可以使用df.loc,但不确定如何实现。
当前代码:
df=pd.read_excel('xyz.xlsx')
while df['Year'== '2019']:
arrived= df['Arrived'].sum()
print(arrived)发布于 2019-06-18 10:35:54
loc命令的第一个输入是索引的筛选器,第二个输入是列。
df.loc[df['Year'] == '2019', 'Arrived'].sum()发布于 2019-06-18 10:39:19
这里的另一种方法是使用groupby操作,以防您想要获得每年的总和:
per_year = df.groupby('Year')['Arrived'].sum()这将为您提供一个系列,然后您可以查看2019年的值,具体如下:
per_year['2019']https://stackoverflow.com/questions/56641038
复制相似问题