llama_index [问题]:AzStorageBlobReader与LlamaParse的集成

sgtfey8w 于 5个月前发布在其他

关注(0)|答案(1)|浏览(138)

问题验证

我已经在文档和Discord上寻找答案。

问题

我目前正在使用 LlamaParse 作为 file_extractor,并与 AzStorageBlobReader 一起读取blob存储中的PDF文件，同时解析文档。目前，这种集成只允许 .load_data() 输出解析结果，可以是文本或markdown格式。是否有办法将解析结果以JSON格式输出，就像LlamaParse中提到的 get_json_result() 一样？
谢谢。

llama_index

来源：https://github.com/run-llama/llama_index/issues/14395

1条答案

按热度按时间

jexiocij1#

是的，当使用LlamaParse作为file_extractor与AzStorageBlobReader一起读取blob存储中的PDF时，可以使用get_json_result()方法输出解析结果为JSON。get_json_result()方法在LlamaIndex框架的DashScopeParse类中定义。
以下是get_json_result()方法的相关代码片段：

def get_json_result(
self, file_path: Union[List[str], str], extra_info: Optional[dict] = None
) -> List[dict]:
extra_info = {"parse_fmt_type": ResultType.DASHSCOPE_DOCMIND.value}
"""Parse the input path."""
try:
return asyncio.run(self.aget_json(file_path, extra_info))
except RuntimeError as e:
if nest_asyncio_err in str(e):
raise RuntimeError(nest_asyncio_msg)
else:
raise


此方法可用于解析输入文件路径并以JSON格式返回结果。

* 要继续与[Dosu](https://dosu.dev)交谈，请提及@dosu。*

赞(0）回复(0）举报 5个月前

我来回答

llama_index [问题]:AzStorageBlobReader与LlamaParse的集成

问题验证

问题

1条答案

相关问题

热门标签

最新问答