我正在尝试使用flume将csv文件放入hdfs,该文件还包含一些unicode字符。
一旦文件存在于hdfs中,我就试图查看内容,但无法正确地查看记录。
文件内容
Name age sal msg
Abc 21 1200 Lukè éxample àpple
Xyz 23 1400 er stîget ûf mit grôzer
控制台输出
是的 hdfs dfs -get /flume/events/csv/events.1234567
下面是输出
Name,age,sal,msg
Abc,21,1200,Luk��xample��pple
Xyz,23,1400,er st�get �f mit gr�zer
flume支持unicode字符吗?如果不是,怎么处理
1条答案
按热度按时间gg58donl1#
是的,flume支持unicode字符。您可以使用flume读取unicode文件并将数据传输到hdfs。这看起来像是其他问题。请将hdfs.filetype更改为datastream,然后查看是否可以正确读取输出。
下面是我使用的一个简单配置。