如何使用tsfresh选择时间序列的前n个特征?我可以决定要提取的前n个特征的数量吗?
pzfprimi1#
根据@Chaitra和this answer的上述评论,我给予了一个答案。您可以使用文档中描述的tsfresh相关性表来确定顶部特征的数量。然后您可以根据p值和顶部n特征对表进行排序。示例代码打印前11个功能:
tsfresh
n
from tsfresh import extract_features from tsfresh.feature_selection.relevance import calculate_relevance_table extracted_features = extract_features( X, column_id="id", column_kind="kind", column_value="value", ) relevance_table = calculate_relevance_table(extracted_features, y) relevance_table = relevance_table[relevance_table.relevant] relevance_table.sort_values("p_value", inplace=True) print(relevance_table["feature"][:11])
1条答案
按热度按时间pzfprimi1#
根据@Chaitra和this answer的上述评论,我给予了一个答案。
您可以使用文档中描述的
tsfresh
相关性表来确定顶部特征的数量。然后您可以根据p值和顶部n
特征对表进行排序。示例代码打印前11个功能: