在使用Milvus与GPTCache(缓存:最大大小)时,出现了一些错误,

mi7gmzs6  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(28)

我想在Milvus中使用gptcache。我参考了示例创建了以下代码:

cache.init(
    embedding_func=onnx.to_embeddings,
    data_manager=data_manager,
    similarity_evaluation=SearchDistanceEvaluation(),
    config=Config(similarity_threshold=0.9,
                auto_flush=5
    )
)

我添加了num_entities来检查大小,发现它管理的实体数量超过了缓存大小。你能告诉我为什么会这样吗?另外,有没有办法让它根据缓存大小工作?

eqzww0vc

eqzww0vc1#

这主要是因为Milvus的num entity只能获得近似的数据行数,不够准确。如果需要确切的行数,需要调用查询接口。你可以参考Milvus文档:https://milvus.io/docs/get-and-scalar-query.md#Use-Advanced-Operators
对于驱逐,也许对另一个问题的解释可以加深对此方面的理解

相关问题