aim Filtering runs by the number of steps/epochs

kwvwclae  于 2个月前  发布在  其他
关注(0)|答案(2)|浏览(29)

🚀 功能

作为用户,我希望能够在指标资源管理器中通过步数/周期数过滤运行。

动机

我有很多运行,其中一些只有几个步骤,因为我只是在调试脚本。所以忽略步数少于X的运行会很有帮助。

提议

在指标资源管理器的过滤器中输入类似(run.steps > 100)的内容,只查看持续时间超过该值的运行

替代方案

在我的特殊情况下,替代方案是选择所有执行步数少于100步的运行,并一次性删除(归档)它们。
感谢考虑!

fnx2tebb

fnx2tebb1#

@avkudr 感谢打开这个问题,它似乎非常有用🙌
我认为如果在训练过程中将步骤计数存储在运行元数据中(与其他运行属性一起),它将使从资源管理器和通过SDK编程方式搜索运行的步骤计数成为可能。
但问题是通常指标具有不同的长度,例如训练损失比验证损失有更多的步骤。
因此,我认为建议的查询语法可以稍作修改。例如:run["loss", {"subset": "train"}].steps > 100
还可以启用按指标最后一步进行搜索,例如run["loss", {"subset": "train"}].value.last <= 0.001
然而,我认为上述语法过于复杂(而且丑陋:D)。
@avkudr @roubkar @alberttorosyan @mahnerak 是否有更好的替代方案?

uelo1irk

uelo1irk2#

我有一个建议。由于metric在查询上下文中指的是一个唯一的度量序列,可以将其作为度量的属性添加步数。因此,语法如下:

metric.steps > 100

还有一件事需要澄清。由于度量是稀疏的,我们应该取最后一步还是跟踪值的数量?

相关问题