我有一个这样的数据集(大尺寸)
id_brand id_member
1 100
2 105
1 106
3 100
我想计算不同品牌之间的余弦相似度。公式如下
{\displaystyle\cos\theta={\frac{\mathbf{a}\cdot\mathbf{b}}{{a}{a}{b}}}}。
我试图在pyspark中透视,但它很复杂,所以我想在sql(redhisft)中透视,但我不知道该怎么做。
谢谢您
暂无答案!
目前还没有任何答案,快来回答吧!