pd.resample函数接受从数组到数字的任何函数作为它的how关键字参数(尽管这不在文档中)。因此,下面的示例运行良好
#!/usr/bin/python
import numpy as np
import pandas as pd
dates = pd.date_range('20130101', periods=60)
df = pd.DataFrame(np.random.randn(60,4), index=dates, columns=list('ABCD'))
print df.resample('10D', how=np.std, axis=0)但是,是否有方法对返回数组的函数执行相同的操作?例如,如果我尝试df.resample('10D', how=np.fft.rfft, axis=0)熊猫将退出:
Exception: Data must be 1-dimensional现在,是否有一种使用具有偏移字符串功能的函数(例如,如果我希望数据中的每个“10分钟”块的fft )具有偏移字符串功能的方法?
我知道我可能可以先用groupby或分离dataframe来实现这一点,但由于熊猫的偏移字符串非常容易使用(在我的实际数据分析领域中特别有用),我想知道如何才能做到这一点,而不会失去它的功能。
编辑
如果我尝试df.groupby(pd.TimeGrouper('10D')).apply(np.fft.rfft, axis=0),它会给出以下错误:
TypeError: cannot concatenate a non-NDFrame object发布于 2015-09-21 20:21:16
因为fft函数改变了输入的形状,所以不能直接应用它。这里有一种方法来包装它。
In [331]: def wrap_fft(df):
...: return pd.DataFrame({c:np.fft.rfft(df[c]) for c in df})
In [332]: df.groupby(pd.TimeGrouper('10D')).apply(wrap_fft)
Out[332]:
A \
2013-01-01 0 (0.54057835524+0j)
1 (3.58718639626-2.07316200855j)
2 (1.31007762632+1.22430332479j)
3 (4.36758085029-0.236242884113j)
4 (-0.0546232575249+2.11668684871j)
5 (1.55071284264+0j)
2013-01-11 0 (4.11929430037+0j)
1 (-0.93001545894-2.65804406349j)
2 (1.20206318744-1.43815460311j)
3 (1.24340282215-4.38679576432j)
4 (-0.582004943723-0.943867990404j)
5 (-1.81316546447+0j)
2013-01-21 0 (-1.49246511083+0j)
1 (-1.15010974637+0.527648266336j)
2 (-2.5428259911+2.36604684921j)
3 (-2.76468733089+0.860053921011j)
4 (-1.41328489201-0.36756122307j)
5 (-3.13773122523+0j)
.........https://stackoverflow.com/questions/32701939
复制相似问题