java 在ColdFusion中规范化字符串

nkkqxpd9 于 2023-05-05 发布在 Java

关注(0)|答案(3)|浏览(134)

我正在尝试在ColdFusion中规范化一个字符串。
我想使用Java类java.text.Normalizer来实现这一点，因为据我所知，CF没有任何类似的函数。
下面是我的当前代码：

<cfset normalizer = createObject( "java", "java.text.Normalizer" ) />
<cfset string = "äéöè" />
<cfset string = normalizer.normalize(string, createObject( "java", "java.text.Normalizer$Form" ).NFD) />
<cfset string = ReReplace(string, "\\p{InCombiningDiacriticalMarks}+", "") />
<cfoutput>#string#</cfoutput>

为什么它总是输出äéöè而不是一个规范化的字符串？

Java

来源：https://stackoverflow.com/questions/11626050/normalize-string-in-coldfusion

3条答案

按热度按时间

xdnvmnnf1#

与Java不同，在ColdFusion中，不需要转义字符串中的反斜杠。您当前的正则表达式将不匹配任何不以反斜杠开头的内容，因此不会发生替换。
除此之外，您的代码是完全正确的，您可以看到在输出时字符串的长度是8，而不是4。这是normalize调用的结果。
但是，请记住，它仍然是原始字符串的等效表示，因此您无法从视觉上区分两者的区别并不奇怪。这是正确的Unicode渲染。

赞(0）回复(0）举报 2023-05-05

6yjfywim2#

您的"\\p"应该只是"\p"。Cf的ReReReplace（）会自动转义反斜杠，因此"\\p"在java端被解释为"\\\\p"
一个内衬：

<cfscript>
var k = "mike's café";
k = createObject( 'java', 'java.text.Normalizer' ).normalize( k, createObject( 'java', 'java.text.Normalizer$Form' ).valueOf('NFD') ).replaceAll('\p{InCombiningDiacriticalMarks}+','').replaceAll('[^\p{ASCII}]+','');
// k is now "mike's cafe"
</cfscript>

http://www.cfquickdocs.com/cf9/#rereplace
(Edit：cfquickdocs链接已断开。域名注册已过期）

赞(0）回复(0）举报 2023-05-05

vdzxcuhz3#

我推荐使用像Junidecode这样的Java库。https://github.com/gcardone/junidecode
它将UTF8和UTF16字符串转换为ASCII7。示例：

äéöè = aeoe
Mike's Cafe（迈克咖啡馆）
= TEL
北亰 = Bei Jing
Mr. = Mr.竹田正行
⠏⠗⠑⠍⠊⠑⠗ = premier
ราชอาณาจักรไทย = raach`aanaacchakraithy
Ellenika
莫斯科河
Հայաստան = Hayastan
ℰ𝒳𝒜ℳ𝓟ℒℰ = EXAMPLE

我已经分享了一个完整的基于ColdFusion的演示（需要Junidecode JAR文件）：https://dev.to/gamesover/convert-unicode-strings-to-ascii-with-coldfusion-junidecode-lhf
下面是代码函数：

<cfscript>
function JUnidecode(inputString){
    var JUnidecodeLib = "";
    var response = "";
    var temp = {};
    temp.encoder = createObject("java", "java.nio.charset.Charset").forName("utf-8").newEncoder();
    temp.isUTF = temp.encoder.canEncode(arguments.inputString);
    if (temp.isUTF){
        /* NFKC: UTF Compatibility Decomposition, followed by Canonical Composition */
        temp.normalizer = createObject( "java", "java.text.Normalizer" );
        temp.normalizerForm = createObject( "java", "java.text.Normalizer$Form" );
        arguments.inputString = temp.normalizer.normalize( javaCast( "string", arguments.inputString ), temp.normalizerForm.NFKC );
    }
    try {
        JUnidecodeLib = createObject("java", "net.gcardone.junidecode.Junidecode");
        response = JUnidecodeLib.unidecode( javacast("string", arguments.inputString) );
    } catch (any e) {
        response = "ERROR: JUnidecode is not installed";
    }
    return trim(Response.replaceAll("\[\?\]", ""));
}
function isDiff(compareArr, val, pos){
    return (pos GT arrayLen(comparearr) OR comparearr[pos] neq val);
}
</cfscript>

赞(0）回复(0）举报 2023-05-05

我来回答

java 在ColdFusion中规范化字符串

3条答案

相关问题

热门标签

最新问答