使用scala将emoji作为输入提供时获取unicode

lokaqttq  于 2021-07-13  发布在  Spark
关注(0)|答案(1)|浏览(418)

我是scala和spark的新手。我正在开发一个大数据项目,我想输入一个emoji并使用scala和spark获得它的unicode。我试着寻找资源作为指导,但我找不到任何。
例如-

val inputEmoji = ?

然后输出应提供u+1f603作为答案

wsewodh2

wsewodh21#

您可以在spark中用utf-32对表情符号进行编码:

val inputEmoji = "?"

val df = Seq(inputEmoji).toDF("emoji")

val result = df.selectExpr(
    "emoji",
    "'U+' || trim('0', string(hex(encode(emoji, 'utf-32')))) as result"
)

result.show
+-----+-------+
|emoji| result|
+-----+-------+
|   ?|U+1F603|
+-----+-------+

相关问题