在未来,特征选择选项可能会非常有用。当我使用TensorFlow和Ray RLlib时,我使用了mlxtend库,它运行得非常好。
7d7tgy0s1#
好的建议!我可以看到这个在automl包的样本数据集上运行时,可以从配置中剪除无用的特性。
automl
kh212irz2#
@tgaddair 我使用mlxtend工具,它对我来说非常有用。它可以与许多模型神经网络、xgboost和其他树模型、sklearn模型一起工作。结果可以保存为xlsx文件作为报告。有两种主要方法来查找最佳特征集:正向搜索和反向搜索,通常我都使用这两种方法。
我对特征工程和寻找最佳模型参数有一定的经验,但我的开发技能较低,所以我认为ludwig对我来说会非常有用。现在我正在尝试添加选项fill_with_median用于数值值,因为中位数对于数值特征来说不是一个好选项,如果存在大的偏度(直方图中的长尾)。
fill_with_median
现在我正在尝试理解框架中指定模块之间的依赖关系。
2条答案
按热度按时间7d7tgy0s1#
好的建议!我可以看到这个在
automl
包的样本数据集上运行时,可以从配置中剪除无用的特性。kh212irz2#
@tgaddair 我使用mlxtend工具,它对我来说非常有用。它可以与许多模型神经网络、xgboost和其他树模型、sklearn模型一起工作。结果可以保存为xlsx文件作为报告。有两种主要方法来查找最佳特征集:正向搜索和反向搜索,通常我都使用这两种方法。
我对特征工程和寻找最佳模型参数有一定的经验,但我的开发技能较低,所以我认为ludwig对我来说会非常有用。现在我正在尝试添加选项
fill_with_median
用于数值值,因为中位数对于数值特征来说不是一个好选项,如果存在大的偏度(直方图中的长尾)。现在我正在尝试理解框架中指定模块之间的依赖关系。