全新的Python,可能需要一些帮助来导入多个Excel文件来分离Pandas数据帧。我已经成功地实现了以下代码,但它当然会将所有内容都导入到一个框架中。我想将它们导入到df1、df2、df3、df4、df5等。
任何事都有帮助,谢谢!
import pandas as pd
import glob
def get_files():
directory_path = input('Enter directory path: ')
filenames = glob.glob(directory_path + '/*.xlsx')
number_of_files = len(filenames)
df = pd.DataFrame()
for f in filenames:
data = pd.read_excel(f, 'Sheet1')
df = df.append(data)
print(df)
print(number_of_files)
get_files()发布于 2020-03-31 10:55:33
最简单的方法是使用列表。列表中的每个元素都是一个数据帧
def get_files():
directory_path = input('Enter directory path: ')
filenames = glob.glob(directory_path + '/*.xlsx')
number_of_files = len(filenames)
df_list = []
for f in filenames:
data = pd.read_excel(f, 'Sheet1')
df_list.append(data)
print(df_list)
print(number_of_files)
return df_list
get_files()然后,您可以使用df_list[0]、df_list[1]访问您的数据帧...
发布于 2020-04-01 07:07:15
就像Jezrael的另一个选项一样,在这里回答https://stackoverflow.com/a/52074347/13160821,但针对您的代码进行了修改。
from os.path import basename
def get_files():
directory_path = input('Enter directory path: ')
filenames = glob.glob(directory_path + '/*.xlsx')
number_of_files = len(filenames)
df_list = {basename(f) : pd.read_excel(f, 'Sheet1') for f in filenames}
print(number_of_files)
return df_list
get_files()然后可以通过文件名来访问,例如。dfs['file_name1.xlsx']或dfs['some_file.xlsx']。您还可以执行诸如splitext之类的操作来从键中删除xlsx,或者只使用文件名的一部分。
https://stackoverflow.com/questions/60942686
复制相似问题