将ebcdic转换为ascii文件格式-用于配置单元的serde如何克服ebcdic文件中的分隔符问题

fgw7neuy  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(387)

在ebcdic中没有比/n更好的了。ebcdic中不支持新行。我该怎么转换成那样。ebcdic中没有分隔符。所以在转换这个文件的时候。我怎么知道新的生产线来了?请给我一些建议。

tnkciper

tnkciper1#

实际上有一个新行字符(x'15')。普通的zos文件不使用换行符。zos是围绕固定宽度、vb、vsam等文件构建的。
选项包括:
如果是文本文件(不太可能),则在从主机传输文件时将其转换为ascii。
在大型机上将文件转换为文本,并在转出大型机时进行转换。
使用商业 Package 。同步排序有dmx-h,也有datameer
如果您有cobol copybook,请查看以下开源软件包:
https://wiki.cask.co/display/ce/plugin+for+cobol+copybook+reader+-+fixed+length
https://index.pocketcluster.io/tmalaska-copybookinputformat.html
https://github.com/ianbuss/copybookhadoop
https://sourceforge.net/projects/coboltocsv/
jrecord可以与cobol copybook、纯java代码或xml文件描述6一起使用。

wvyml7n5

wvyml7n52#

ebcdic中的新行通常由回车符(hex 0d)和换行符(hex 25)组成。在ascii中,回车也是十六进制0d,但换行符需要转换为十六进制0a。希望这有帮助。

相关问题