嗨,Stack溢出社区。
我有5年的每周价格数据超过15K产品(5*15K**52记录)。每个产品都是一个单变量时间序列。目的是预测每种产品的价格。
我熟悉单变量时间序列分析,在这种分析中,我们可以可视化每个ts序列,绘制其ACF、PACF和预测序列。但是,在这种情况下,当我有15K不同的时间序列时,单变量时间序列分析是不可能的,不能对每个时间序列、其ACF、PACF和预测每个产品的分别进行可视化,并对其进行调整/决策。
我正在寻找一些建议和指导,以解决这个多系列预测问题使用R(更好)。如有任何帮助和支持,将不胜感激。
提前谢谢。
发布于 2020-09-03 21:42:19
我建议您使用auto.arima包中的forecast。
这样你就不用去寻找正确的ARIMA模型了。
auto.arima:根据AIC、AICc或BIC值返回最佳ARIMA模型。该函数在所提供的订单约束范围内对可能的模型进行搜索。
fit <- auto.arima(WWWusage)
plot(forecast(fit,h=20))而不是WWWusage,您可以放置一个时间序列,以适应ARIMA模型。然后使用forecast执行预测--在本例中,提前20步(h=20)。
auto.arima基本上为您选择ARIMA参数(根据Akaike信息标准)。
如果对你来说计算成本太高的话,你必须试一试。但总的来说,预测这么多时间序列并不少见。
另一件要记住的事情可能是,时间序列中可能存在某种相互关联,这毕竟不是那么不可能。因此,从预测精度的角度来看,不把这看作是一个单变量预测问题是有意义的。
这个设置听起来非常类似于最近在Kaggle上举行的m5预测竞争。目标是预测沃尔玛在美国销售的各种产品的单位销售额。
所以很多时间序列的销售数据都要预测。在这种情况下,胜利者没有做单变量预测。这里是对获奖解决方案的描述的链接。由于设置看起来与您的非常相似,在kaggle论坛上阅读一下这个挑战可能是有意义的--甚至可能有有用的笔记本(代码示例)可供使用。
https://stackoverflow.com/questions/63731928
复制相似问题