我正在写一个java程序逻辑,用于打印带有出现次数和行号的wrods。下面是代码
package test;
import java.util.HashMap;
import java.util.Scanner;
import java.util.Set;
public class Countcharacters {
/**
* @param args
*/
static HashMap<String, Integer> countcharact=new HashMap<>();
static HashMap<String, String> linenumbertrack=new HashMap<>();
static int count=1;
static void countwords(String line){
//System.out.println(line);
String[] input=line.split("\\s");
int j=0;
String linenumber="";
for(int i=0;i<input.length;i++){
//System.out.println(input[i]);
if(countcharact.containsKey(input[i])==true){
j=countcharact.get(input[i]);
linenumber=linenumbertrack.get(input[i]);
countcharact.put(input[i],j+1);
linenumbertrack.put(input[i],linenumber+", "+count);
}
else{
countcharact.put(input[i], 1);
linenumbertrack.put(input[i],count+"" );
}
}
count++;
}
public static void main(String[] args) {
// TODO Auto-generated method stub
String inp="the quick brown fox jumped over the lazy dog's bowl.\nthe dog was angry with the fox for considering him lazy.";
String[] line=inp.split("\n");
for(int i=0;i<line.length;i++){
Countcharacters.countwords(line[i]);
}
Set<String> s=countcharact.keySet();
for(String c:s){
System.out.println(c+" "+countcharact.get(c)+" "+"["+linenumbertrack.get(c)+"]");
}
}
}
我得到的输出是
over 1 [1]
quick 1 [1]
lazy. 1 [2]
lazy 1 [1]
considering 1 [2]
jumped 1 [1]
was 1 [2]
for 1 [2]
angry 1 [2]
brown 1 [1]
him 1 [2]
fox 2 [1, 2]
the 4 [1, 1, 2, 2]
with 1 [2]
bowl. 1 [1]
dog's 1 [1]
dog 1 [2]
但我有两个问题。
第1次:如果您看到"the"出现次数为4,但行号为[1,1,2,2],而应该仅为[1,2]。
2nd:我想对它们进行排序,应该先按基数降序排序,然后按字母顺序排序。
就像这样:
the 4 [1,2]
fox 2 [1,2]
lazy 2 [1,2]
angry 1 [1]
bowl 1 [1]
.
.
1条答案
按热度按时间kwvwclae1#
最好是抽象出类中数据的逻辑单元,在你的问题中你有两个清晰的单元:
1.单词出现(单词串和行号)。
1.有关单词的统计信息(出现次数、出现的行号集等)。
使用这些类,您可以首先将
text
分解为List
或WordOccurrence
的Map
;因此,对于每个不同的字,Map
将包含具有以下内容的条目:1.等于实际
String
字的键1.值等于
List
,其中包含WordOccurrence
对象,用于text
中的每个匹配项您可以通过以下方式实现此目的:
然后,你可以很容易地将这个Map转换成
WordStats
的List
(使用灵活的参数化标准排序),如下所示:一旦你把你的问题分解成更小的直观的逻辑分组组件(类、方法、数据结构等),剩下的唯一事情就是把它们连接起来。
以下代码是此解决方案的完整工作演示,供您使用:
Complete code on GitHub