llama.cpp 如何在Android上利用GPU加速推理?

edqdpe6u  于 4个月前  发布在  Android
关注(0)|答案(3)|浏览(77)

#8704 中讨论

原帖由 ElaineWu66 于2024年7月26日发布
我正在尝试在我的安卓设备(高通骁龙)上使用linux和termux编译并运行llama.cpp演示。
关于如何利用GPU的建议?
我已经按照教程 https://github.com/JackZeng0208/llama.cpp-android-tutorial 进行了操作,但是由于OpenCL已经损坏并被移除,所以它无法正常工作。
谢谢!

0h4hbjxa

0h4hbjxa1#

翻译结果为:Android文档可以在这里找到(请让我知道它是否仍然最新):https://github.com/ggerganov/llama.cpp/blob/master/docs/android.md

一段时间前,我看到有人构建了基于Android的Vulkan,虽然有点用但是有bug。我自己没有测试过,但是你可以尝试一下:https://github.com/ggerganov/llama.cpp/issues?q=is%3Aissue+android+vulkan+

af7jpaap

af7jpaap2#

Android文档可以在这里找到(请让我知道它是否仍然最新):https://github.com/ggerganov/llama.cpp/blob/master/docs/android.md

前段时间我看到有人构建了基于Android和Vulkan的程序,虽然有点问题,但似乎还能用。我自己没有测试过,但你可以试试:https://github.com/ggerganov/llama.cpp/issues?q=is%3Aissue+android+vulkan+

按照Android文档的说明,我成功地编译并运行了基于Android CPU的程序。我只是想知道如何利用GPU。

我看到有人提到他们构建了基于Android和Vulkan的程序,但存在一些问题,而且没有详细的说明。我非常新手,有没有我可以遵循的逐步教程?非常感谢!

v8wbuo2f

v8wbuo2f3#

很遗憾,我目前没有在研究vulkan或android,所以无法提供太多帮助。如果有人能分享一下如何实现这个功能就太好了。你可能可以参考这个帖子寻找线索:#5186

相关问题