anything-llm [BUG]: 印地语(Hindi)语言不完全支持,输出中显示为乱码文本

t3irkdon  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(40)

你在运行AnythingLLM时遇到了什么问题?
Docker (本地)
你遇到了什么问题?
Bug报告:LLM响应中印地语文本显示不正确

摘要:

在它的响应中,印地语文本无法正确显示。文本包含错误的字符和格式问题,使其难以阅读且不准确。

详情:

当要求印地语笑话时,LLM给出的响应包含乱码文本和错误的字符。以下是问题的示例:

预期的印地语响应 :

"तीन चिकने होकर एक चिकनी के पास आते हैं और उसने उनसे पूछा - आप क्या चाहते हो? चिकने बोले - हम एक चिकनी को पकाना चाहते हैं। चिकनी ने बोली - अच्छा, फिर आप लोग एक दूसरे को पका लो और मैं बाकी रह जाऊंगी।"

实际收到的响应 :

"तीन चिकने होकर एक चिकनी के पास आते हैं और उसने उनसे 😀😁😂😃😄😅😆😉😊😋😎😍😘😗😙😚🙂🙃😉😌😍😘😗😙😚🙂🙃😉"

观察到的问题 :

  1. 不正确的字符:"😀😁😂😃😄😅😆😉😊😋😎😍😘😗😙😚🙂🙃😉" 应该为 "मान्न", "मेरी"。
  2. English characters的随机插入。
  3. 不正确的格式破坏了文本的可读性。

重现步骤 :

  1. 用印地语笑话查询LLM。
  2. 注意响应中的任何乱码或错误字符。

预期结果 :

LLM应该提供没有乱码字符或随机英文插入的正确格式的印地语文本。响应应该是:
请将此bug作为影响印地语使用者可用性的应用的问题优先处理。

9udxz4iz

9udxz4iz1#

你确定这是LLM的输出,而不是实际的LLM输出吗?我们不会在输出上应用字符集转换器——我们只是存储从LLM缓冲区返回的内容。

相关问题