首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python大熊猫如何在使用后组合切片

python大熊猫如何在使用后组合切片
EN

Stack Overflow用户
提问于 2018-09-22 11:06:59
回答 1查看 512关注 0票数 0

我有一个dataframe,有两列和5000行。类似:A B 0 1 4 1 5 5 2 3 3 9 7. 5000 8 3

我想每100步分离一次数据。所以我吃了50片。为了进行培训,接下来我要做的是将50片重新组合成一个新的数据帧或数组,或者我可以将数据输出到csv文件中的所有内容。

我使用下面的命令将dataframe分割成片:

代码语言:javascript
复制
df_original=pd.read_csv('/data.csv')
df=pd.DataFrame(df_original, columns=['A','B'])
for i in range(0,len(df['A']),100):
    df_100=df[i:i+100]

在执行上述命令之后,如何组合下一步的切片?任何建议都会有帮助。非常感谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-09-22 13:16:19

如果您想拥有50个csv文件:

代码语言:javascript
复制
for i in range(0,len(df['A']),100):
    df_100=df[i:i+100]
    df_100.to_csv("file"+str(i)+".csv", index=False)

如果您想对这些切片数据文件进行一些处理,可以将它们存储在字典中:

代码语言:javascript
复制
dict_of_df = {}
for i in range(0,len(df['A']),100):
    dict_of_df["slice{}".format(i)]=df[i:i+100]

因此,您将通过dict_of_df[key]访问切片数据,其中key = "slice0", "slice100", "slice200", ...

当您已经完成了这些切片数据文件并希望将它们组合起来时,

代码语言:javascript
复制
df_final = pd.DataFrame()
for key, values in dict_of_df.items():
    df_final = df_final.append(dict_of_df[key])

检查df_final是否没有很好地排序,那么:

代码语言:javascript
复制
df_final = df_final.sort_index()

并输出回csv:df_final.to_csv("filename.csv")

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52456063

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档