我计算包含两列userid、productname的文件的余弦相似性。我使用dimsum计算相似的列。更改阈值时,mae的值保持不变。
代码:
val approx = mat.columnSimilarities(0.5)
val exactEntries = exact.entries.map { case MatrixEntry(i, j, u) => ((i, j), u) }
val approxEntries = approx.entries.map { case MatrixEntry(i, j, v) => ((i, j), v) }
val MAE = exactEntries.leftOuterJoin(approxEntries).values.map {
case (u, Some(v)) =>
math.abs(u - v)
case (u, None) =>
math.abs(u)
}.mean()
println(s"Average absolute error: $MAE")
如何用不同的阈值来改变mae的值?
暂无答案!
目前还没有任何答案,快来回答吧!