我使用gbtregressor算法(https://spark.apache.org/docs/2.2.0/api/java/index.html?org/apache/spark/ml/regression/gbtregressor.html)在pyspark中有500棵树,我使用命令转换得到一个预测。
但现在,我的目标是利用每棵树的结果来构造置信区间,并对其应用分位数(0.05和0.95)来构造预测的区间上限和下限。
因此,我想获得在python sklearn中使用属性“estimators”可以找到的每棵树的结果(https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.gradientboostingregressor.html). 但是我在pyspark中找不到其他方法来获得这些估计量。
有没有办法得到它并计算我的时间间隔?
谢谢,
尹
暂无答案!
目前还没有任何答案,快来回答吧!