问题验证
- 我已经在文档和Discord上寻找答案。
问题
我目前正在使用 LlamaParse
作为 file_extractor
,并与 AzStorageBlobReader
一起读取blob存储中的PDF文件,同时解析文档。目前,这种集成只允许 .load_data()
输出解析结果,可以是文本或markdown格式。是否有办法将解析结果以JSON格式输出,就像LlamaParse中提到的 get_json_result()
一样?
谢谢。
我目前正在使用 LlamaParse
作为 file_extractor
,并与 AzStorageBlobReader
一起读取blob存储中的PDF文件,同时解析文档。目前,这种集成只允许 .load_data()
输出解析结果,可以是文本或markdown格式。是否有办法将解析结果以JSON格式输出,就像LlamaParse中提到的 get_json_result()
一样?
谢谢。
1条答案
按热度按时间jexiocij1#
是的,当使用
LlamaParse
作为file_extractor
与AzStorageBlobReader
一起读取blob存储中的PDF时,可以使用get_json_result()
方法输出解析结果为JSON。get_json_result()
方法在LlamaIndex框架的DashScopeParse
类中定义。以下是
get_json_result()
方法的相关代码片段:def get_json_result(
self, file_path: Union[List[str], str], extra_info: Optional[dict] = None
) -> List[dict]:
extra_info = {"parse_fmt_type": ResultType.DASHSCOPE_DOCMIND.value}
"""Parse the input path."""
try:
return asyncio.run(self.aget_json(file_path, extra_info))
except RuntimeError as e:
if nest_asyncio_err in str(e):
raise RuntimeError(nest_asyncio_msg)
else:
raise