我一直在尝试将序列文件写入gcs bucket,并且必须根据数据中的特定字段来管理它们的分区。这就创建了一个场景,即每秒(约100个存储桶/秒)写入多个配置单元分区目录(在同一gcs存储桶内)。
由于堆空间耗尽内存,作业在几分钟后失败。
我还使用visualvm进行了一些内存分析,看到mediahttpuploader占用了大部分内存,并且不经常释放它。
即使在失败/取消作业之后,我看到内存峰值仍保持原样(内存泄漏?)。有人能推荐一个解决这个问题的方法吗?
我一直在尝试将序列文件写入gcs bucket,并且必须根据数据中的特定字段来管理它们的分区。这就创建了一个场景,即每秒(约100个存储桶/秒)写入多个配置单元分区目录(在同一gcs存储桶内)。
由于堆空间耗尽内存,作业在几分钟后失败。
我还使用visualvm进行了一些内存分析,看到mediahttpuploader占用了大部分内存,并且不经常释放它。
即使在失败/取消作业之后,我看到内存峰值仍保持原样(内存泄漏?)。有人能推荐一个解决这个问题的方法吗?
暂无答案!
目前还没有任何答案,快来回答吧!