所以我有一个Dataframe,它有40.107列和4.827行,我想执行pca。这意味着我将有40.107个特性和4.827行(双倍值,因为spark的密集向量只接受双倍值)。我想知道协方差矩阵有多大(mb/gb)以及如何计算它的大小?有没有可能知道驾驶员需要多少内存才能从工人那里获得协方差矩阵并进行奇异值分解?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!