Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

请问有什么方法适用于多份时间序列吗 #56

Open
Enderfga opened this issue Sep 21, 2022 · 7 comments
Open

请问有什么方法适用于多份时间序列吗 #56

Enderfga opened this issue Sep 21, 2022 · 7 comments
Labels
enhancement New feature or request

Comments

@Enderfga
Copy link

我想把HyperTS用在一个新冠患者人数的数据集中,所以有不同国家相同时间段的数据,国家是否可以作为协变量?同一时间点有多个国家的数据,而且时间长度有差异

@zhangxjohn
Copy link
Collaborator

目前,协变量支持的功能性是突出某时间点是否与其他时间点存在差异性。如果您想多国家一起预测,那么如果所有国家在时间点上是对齐的,可以采用多变量预测来建模。

@Enderfga
Copy link
Author

训练集是多国家的时序数据 测试集是新的国家的未来数据 请问这样的功能可以实现吗

@zhangxjohn
Copy link
Collaborator

这样大概是不行的,数据已经不是同分布了。

@yunchenran
Copy link

我也有同样的问题,比如预测商家/商品销量,不同商家/商品的销售时间可能是做不到一一对应的,这种情况下如果要用这个库有没有示例呢?
把所有商家的销量和特征放到一个训练集里会报错么(因为会出现相同或不连续的时间)

@zhangxjohn
Copy link
Collaborator

我也有同样的问题,比如预测商家/商品销量,不同商家/商品的销售时间可能是做不到一一对应的,这种情况下如果要用这个库有没有示例呢? 把所有商家的销量和特征放到一个训练集里会报错么(因为会出现相同或不连续的时间)

是不同商家/商品出现了采样缺失吗(即没有销量无记录状态)?
如果是这样,您可以对于数据先做一个简单的处理,依据所有商品的销量的最小时间频率对齐所有商家的所有商品销量,其中补充出的时间特征位置可以置0(即该时间点无销量)。

@yunchenran
Copy link

依据所有商品的销量的最小时间频率对齐所有商家的所有商品销量
嗯嗯 好的 感谢。
另外这种情况下数据里的商家/商品的 ID 假如不想当特征的话,是直接忽略掉就可以么,这样一份数据里同一天的数据可能出现多个样本是 OK 的么?还是说只能对单个商家/商品分别建模(但是这样的量级可能无法接受)
还有就是这种选择预测模式的话是算作多变量时序预测?

@newbei
Copy link
Collaborator

newbei commented Sep 29, 2022

你好,对于以上提到销量预测的数据情况,可以这样处理:
1、将商品/商品的ID两列拼接为一列"商家_商品ID"列
2、通过行转列的方法(可以用pandas 的pivot_table方法),将每个商家_商品ID值,转成时间序列。

预测模式选择多变量预测。

@zhangxjohn zhangxjohn added the enhancement New feature or request label Sep 30, 2022
# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

4 participants