Apache Camel -提取包含多个CSV的TGZ文件

pvabu6sv  于 2022-11-07  发布在  Apache
关注(0)|答案(1)|浏览(135)

我是Apache Camel的新手,正在学习它的基础知识。我正在使用Yaml DSL,我有一个TGZ文件,其中包括2个小CSV文件。
我尝试使用gzipDeflater解压缩文件,但是当我在解压缩后打印正文时,它包含了一些关于CSV的数据(文件名、我的用户名、一些数字)-这使得我无法仅通过已知的列来解析CSV。
由于提取的文件包含原始CSV中未包含的行,因此每当处理其中的一行时,就会出现异常。
有没有一种方法可以让我“忽略”这些行,或者Apache Camel的另一个功能可以让我只访问这些CSV的内容?
谢谢你!

xriantvc

xriantvc1#

您可能有一个gzip压缩的tar文件,它与deflate压缩文件略有不同。
试试这个(如果你愿意,可以转换成YAML):

from("file:filedir")
    .unmarshal().gzip()
    .split(new TarSplitter())
        // process/unmarshal CSV

相关问题