pandas 包含模型中的归属项

hjzp0vay  于 2022-12-28  发布在  其他
关注(0)|答案(1)|浏览(111)

如果你有这样的数据(价格和市值是不真实的)

Date        Stock   Close   Market-cap   GDP
15.4.2010   Apple    7.74       1.03     ...
15.4.2010   VW      50.03       0.8      ...
15.5.2010   Apple    7.80       1.04     ...
15.5.2010   VW      52.04       0.82     ...

其中收盘价是你想要预测的y,市值和GDP是你的x变量,你是否还将股票作为另一个自变量包括在你的模型中,因为它可能是,例如,苹果的价格建设不同于大众。
如果是的话,你会怎么做?我的想法是在股票列中给苹果赋值0,给大众赋值1。

n3schb8v

n3schb8v1#

你首先需要确定你到底要预测什么。就目前而言,你有纵向数据,这样你就有了**同一家公司在一段时间内的多个测量数据。

  • 您是否试图根据market cap + GDP预测close price
  • 或者,您是否试图根据previous收盘价测量结果预测future收盘价?

你可以根据公司名称来划分,但这取决于你想要达到的目标。你想要回答的问题是什么?
您可能还需要考虑以下因素:

  • 同一公司在不同时间测量的收盘价彼此相关。
  • 彼此紧接着的两个测量之间的相关性将比在时间上相隔很远的两个测量之间的相关性更好。

存在与线性回归模型相关联的four assumptions

*线性:X和Y的平均值之间的关系是线性的。
*同方差性:残差的方差对于任何X值都是相同的。
*独立性:观察结果彼此独立。
*正态性:对于X的任何固定值,Y呈正态分布。

相关问题