mlc-llm [跟踪] 创建一个CPU兼容的PagedKVCache

swvgeqrz  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(37)

概述

为了通用的紧凑目的,有一个CPU/NPU兼容的PagedKVCache是有用的。

行动项

  • 提供一个CPU兼容的PagedKVCache内核

相关问题和PR链接

jrcvhitl

jrcvhitl1#

+1 有些NPU无法像CPU一样绑定线程,因此无法使用PagedKVCache。有任何最新的进展吗?

相关问题