我有一个dataframe,有两列和5000行。类似:A B 0 1 4 1 5 5 2 3 3 9 7. 5000 8 3
我想每100步分离一次数据。所以我吃了50片。为了进行培训,接下来我要做的是将50片重新组合成一个新的数据帧或数组,或者我可以将数据输出到csv文件中的所有内容。
我使用下面的命令将dataframe分割成片:
df_original=pd.read_csv('/data.csv')
df=pd.DataFrame(df_original, columns=['A','B'])
for i in range(0,len(df['A']),100):
df_100=df[i:i+100]在执行上述命令之后,如何组合下一步的切片?任何建议都会有帮助。非常感谢。
发布于 2018-09-22 13:16:19
如果您想拥有50个csv文件:
for i in range(0,len(df['A']),100):
df_100=df[i:i+100]
df_100.to_csv("file"+str(i)+".csv", index=False)如果您想对这些切片数据文件进行一些处理,可以将它们存储在字典中:
dict_of_df = {}
for i in range(0,len(df['A']),100):
dict_of_df["slice{}".format(i)]=df[i:i+100]因此,您将通过dict_of_df[key]访问切片数据,其中key = "slice0", "slice100", "slice200", ...
当您已经完成了这些切片数据文件并希望将它们组合起来时,
df_final = pd.DataFrame()
for key, values in dict_of_df.items():
df_final = df_final.append(dict_of_df[key])检查df_final是否没有很好地排序,那么:
df_final = df_final.sort_index()并输出回csv:df_final.to_csv("filename.csv")
https://stackoverflow.com/questions/52456063
复制相似问题