unstructured 与客户不一致的非结构化、不灵活

j2qf4p5b  于 2个月前  发布在  其他
关注(0)|答案(3)|浏览(43)

描述问题

Unstructured.io HTTP API 不接受 multipart/related 内容类型的文件。当通过网络浏览器上传 .mht 文件时,会出现这个问题,因为浏览器会将文件发送为 multipart/related。然而,使用 Insomnia 等工具将文件作为 application/octet-stream 发送可以正常工作,即使是 .mht 文件。这种文件类型处理的不一致性导致了文件上传过程中的困惑和潜在错误。

重现步骤

  1. 尝试使用浏览器向 Unstructured.io API 上传一个 .mht 文件。注意浏览器将内容类型设置为 multipart/related。
  2. 观察错误:{"detail":"File type multipart/related is not supported."}
  3. 现在,使用 Insomnia 上传相同的 .mht 文件,Insomnia 将内容类型设置为 application/octet-stream。
  4. 文件上传成功,没有任何错误。

预期行为

API 应该始终一致地处理 .mht 文件上传,无论使用的客户端是什么,或者客户端设置的内容类型是什么。如果不支持 multipart/related,应该有明确的文档或错误信息指导用户选择合适的文件类型和处理方法。

额外背景

这里主要关注的是不同客户端如何处理文件类型以及 Unstructured.io 如何应对这些变化的不一致性。这引发了一个问题,是否最好避免传递文件类型,以及是否有更标准化的文件上传方法来确保兼容性和易用性。

mjqavswn

mjqavswn1#

感谢您的反馈-我们会查看并尽快回复您!

vwhgwdsa

vwhgwdsa2#

嘿,@AndryHTC,我们正在努力将这个任务优先处理。想知道你是否有一个示例mht文件,我们可以使用它来重现?谢谢!

oewdyzsn

oewdyzsn3#

嘿,@AndryHTC,我们正在努力将这个优先级提高。想知道你有没有一个示例mht文件,我们可以用来重现?谢谢!

@amanda103 不幸的是,所有的 .mht 都是来自我们的用户,我们不能暴露他们的数据。在短时间内我无法复制一个不透明的mht文件

相关问题