while(tokenizer.hasMoreTokens()){
currentWord = tokenizer.nextToken();
String[] parts = currentWord.split(Pattern.quote("."));
String[] parts2 = parts[0].split(Pattern.quote(","));
String[] parts3 = parts2[0].split(Pattern.quote("?"));
String[] parts4 = parts3[0].split(Pattern.quote("\\.| "));
String[] parts5 = parts4[0].split("\"");
String[] parts6 = parts5[0].split(Pattern.quote(":"));
System.out.println(Arrays.toString(parts6));
我只是想把这段文字适当地分开,现在唯一的问题是这个词:
“有
此外,如果有人能提供一个解决方案,将所有这一切结合到一条线,这将是很好的,但我不能得到的工作,谢谢
4条答案
按热度按时间uqjltbpv1#
试试这个。
\用于转义"","\"用于转义正则表达式特殊字符.""&"?"。我们将用空字符串替换其中的任何.,":"。
8aqjt8rx2#
API中有一些专门的类可以解析文本中的单词,下面就是其中之一:
cetgtptt3#
如果你想在非字母上分割一行,这里有一种方法。
[^A-Za-z]+
拆分一个或多个非字母印刷品
另一方面,如果你想从一个单词中删除这些字符,使用类似的模式。不需要单独指定非字母字符。
印刷品
gkn4icbw4#
下面的代码显示了如何忽略所有非字母字符。