如何计算余弦相似度的rmse?

tag5nh1u  于 2021-07-12  发布在  Spark
关注(0)|答案(0)|浏览(294)

我计算包含两列userid、productname的文件的余弦相似性。我使用dimsum计算相似的列。更改阈值时,mae的值保持不变。
代码:

val approx = mat.columnSimilarities(0.5)

val exactEntries = exact.entries.map { case MatrixEntry(i, j, u) => ((i, j), u) }
val approxEntries = approx.entries.map { case MatrixEntry(i, j, v) => ((i, j), v) }
val MAE = exactEntries.leftOuterJoin(approxEntries).values.map {
  case (u, Some(v)) =>
    math.abs(u - v)
  case (u, None) =>
    math.abs(u)
}.mean()

println(s"Average absolute error: $MAE")

如何用不同的阈值来改变mae的值?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题