|
发表于 2023-4-19 17:05:47
|
显示全部楼层
您好,您说的这个问题非常关键,我是这么思考的:
目前的长期预测的9个数据集的特点在于,他们一个数据集就是一个超级长的序列,每个batch是从整体序列中切分出来的。因此不管是哪个batch,他们的temporal pattern都是类似的(因为是同一个场景下的观测),所以直接用linear层中固定的参数去模拟也可以做的不错。训练集和测试集的模式明显不一致,其实暗含的是一个temporal shift的问题,这是由于目前9个数据集的划分方式是直接按照时间去划分的。不过我觉得长期预测的9个数据集是设置是合理的,因为在实际应用时,我们只需要关注一个工厂、一个传感器的情况,并且模型部署之后需要应对未来很长时间的temporal shift。
除了上面9个数据集之外,TimesNet还在M4上做了实验,M4的特点是每一个sample都是独立的,也就意味着他们的temporal pattern相差很多,在M4上我们会发现单层linear模型效果非常差,这是因为他们试图使用一个固定的参数去模拟多样的temporal pattern。
总结来看,不同数据集中突出的关键问题使不一致的,所以我觉得后面大家在做预测模型的时候,也许可以除了9个长时预测数据集之外,也跑一下M4这样多样的数据集,可以更全面地验证自己的模型是否有效。 |
|