我是scala和spark的新手。我正在开发一个大数据项目,我想输入一个emoji并使用scala和spark获得它的unicode。我试着寻找资源作为指导,但我找不到任何。例如-
val inputEmoji = ?
然后输出应提供u+1f603作为答案
wsewodh21#
您可以在spark中用utf-32对表情符号进行编码:
val inputEmoji = "?" val df = Seq(inputEmoji).toDF("emoji") val result = df.selectExpr( "emoji", "'U+' || trim('0', string(hex(encode(emoji, 'utf-32')))) as result" ) result.show +-----+-------+ |emoji| result| +-----+-------+ | ?|U+1F603| +-----+-------+
1条答案
按热度按时间wsewodh21#
您可以在spark中用utf-32对表情符号进行编码: