您的功能请求是否与问题相关?请描述。
是的。我想了解有多少个试验处于待处理/运行/已完成状态。我如何从外部获取状态?
描述使用场景
作为用户,一旦我启动任务,我就想了解程序的进度。
描述您希望的解决方案
ludwig更像是一个SDK,似乎很难从外部获取程序状态?如果没有优雅的方法可以实现,我们能否更新一个文件,以便外部程序可以读取该文件以获取最新更新?
描述您考虑过的替代方案
无
附加上下文
fafcakar1#
你好,Jeffwan!很好的问题!要获取超参数优化试验状态的最直接方法是在结果日志目录中创建的 experiment_state-<datetime>.json 文件。该文件包含一个检查点列表,其中每个检查点都是一个包含试验信息的字典。您可以查看每个字典中的 status 键以及整体检查点列表,以查询超参数实验的状态。这是否足以解决您的用例?另一种编程方式是使用 Ray Tune 回调,每次使用回调时我们都会更新试验状态。
experiment_state-<datetime>.json
status
guz6ccqo2#
ShreyaR
我认为将状态写入文件是很好的,但实时检查状态却很困难。目前,一旦完成,我会将所有文件复制到远程服务器。如果我提供一个服务来检查试用状态,那意味着我的后端服务需要找到文件并解析它以获取状态,这似乎并不十分有前途。但我认为了解统计数据仍然是有帮助的。例如,有多少个试用失败等。
2条答案
按热度按时间fafcakar1#
你好,Jeffwan!很好的问题!
要获取超参数优化试验状态的最直接方法是在结果日志目录中创建的
experiment_state-<datetime>.json
文件。该文件包含一个检查点列表,其中每个检查点都是一个包含试验信息的字典。您可以查看每个字典中的status
键以及整体检查点列表,以查询超参数实验的状态。这是否足以解决您的用例?另一种编程方式是使用 Ray Tune 回调,每次使用回调时我们都会更新试验状态。
guz6ccqo2#
ShreyaR
我认为将状态写入文件是很好的,但实时检查状态却很困难。目前,一旦完成,我会将所有文件复制到远程服务器。如果我提供一个服务来检查试用状态,那意味着我的后端服务需要找到文件并解析它以获取状态,这似乎并不十分有前途。但我认为了解统计数据仍然是有帮助的。例如,有多少个试用失败等。