文章/答案/技术大牛

发布

社区首页 >问答首页 >python大熊猫如何在使用后组合切片

问python大熊猫如何在使用后组合切片
EN

Stack Overflow用户

提问于 2018-09-22 11:06:59

回答 1查看 512关注 0票数 0

我有一个dataframe，有两列和5000行。类似:A B 0 1 4 1 5 5 2 3 3 9 7. 5000 8 3

我想每100步分离一次数据。所以我吃了50片。为了进行培训，接下来我要做的是将50片重新组合成一个新的数据帧或数组，或者我可以将数据输出到csv文件中的所有内容。

我使用下面的命令将dataframe分割成片：

df_original=pd.read_csv('/data.csv')
df=pd.DataFrame(df_original, columns=['A','B'])
for i in range(0,len(df['A']),100):
    df_100=df[i:i+100]

在执行上述命令之后，如何组合下一步的切片？任何建议都会有帮助。非常感谢。

slice

python

pandas

dataframe

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-09-22 13:16:19

如果您想拥有50个csv文件：

for i in range(0,len(df['A']),100):
    df_100=df[i:i+100]
    df_100.to_csv("file"+str(i)+".csv", index=False)

如果您想对这些切片数据文件进行一些处理，可以将它们存储在字典中：

dict_of_df = {}
for i in range(0,len(df['A']),100):
    dict_of_df["slice{}".format(i)]=df[i:i+100]

因此，您将通过dict_of_df[key]访问切片数据，其中key = "slice0", "slice100", "slice200", ...

当您已经完成了这些切片数据文件并希望将它们组合起来时，

df_final = pd.DataFrame()
for key, values in dict_of_df.items():
    df_final = df_final.append(dict_of_df[key])

检查df_final是否没有很好地排序，那么：

df_final = df_final.sort_index()

并输出回csv：df_final.to_csv("filename.csv")

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52456063

复制

相似问题

问python大熊猫如何在使用后组合切片
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python大熊猫如何在使用后组合切片EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python大熊猫如何在使用后组合切片
EN