springbatch-如何将文件本身作为一个项目来处理?

qyzbxkaa  于 2021-07-09  发布在  Java
关注(0)|答案(1)|浏览(359)

我对spring批处理开发还不熟悉。我有以下要求。将有一个带有zip文件的s3源,每个ZipFile将包含多个pdf文件和xml文件。[例如:100个pdf和100个xml文件](xml文件将包含有关pdf的数据)批处理需要读取pdf文件及其关联的xml文件,并将其推送到rest服务/db。
当我看示例时,大部分都涉及如何从文件中读取一行并对其进行处理。在这里,我有项目本身的文件。我想读取一个pdf文件(作为字节)+xml文件(转换成pojo)作为集合,并将其逐个推送到rest服务。
现在,我在一个tasklet中完成所有的读取和处理。但我相信会有更好的解决方案来实施它。请建议,谢谢。

gj3fmq9x

gj3fmq9x1#

面向块的处理模型要求您首先定义项是什么。在您的例子中,一个选项是将一个项目视为pdf文件(数据)及其关联的xml文件(元数据)。您可以创建一个表示此类项的类,并为其创建一个自定义项读取器。一旦这些就绪,您就可以在面向块的步骤中使用读取器和将数据发送到rest端点的处理器。

相关问题