我应该用bucketsort或heapsort对包含频率的hashmap进行排序吗？

nkcskrwz 于 2021-07-06 发布在 Java

关注(0)|答案(1)|浏览(438)

我有一个java格式的hashmap HashMap<String, Integer> frequency . 键是一个字符串，我在其中保存电影的名称，值是所说电影的频率。
我的程序接受用户的输入，所以每当有人把视频添加到收藏夹时，我就进入hashmap并增加它的频率。
现在的问题是，在某一点上，我需要采取最k频繁的电影。我发现我可以在这个leetcode问题中使用bucketsort或heapsort（查看第一个注解），但是我不确定在我的例子中它是否更有效。我的hashmap不断更新，因此如果一个频率发生变化，我需要再次调用排序算法。
根据我的理解，构建Map需要o（n）个时间，其中“n”是电影的数量，即使有重复的电影，因为它需要增加频率，这就得到了我独特的电影标题。这是否意味着heapsort会对任何给定的k产生o（m*log（k））和bucketsort o（m）？

Java frequency complexity-theory bucket-sort HeapSort

来源：https://stackoverflow.com/questions/64846176/should-i-sort-a-hashmap-that-contains-frequency-with-bucketsort-or-heapsort

1条答案

按热度按时间

20jt8wwn1#

不幸的是，拥有一个按值排序的Map（Map到的对象）不是一件事。相反，您可以有一个键集，它的键按频率排序，但是如果频率是该点的键，那么在事先不知道频率的情况下，就无法在该集中查找条目，这样就消除了练习的重点。
想到的一个策略是有两个独立的数据结构。一种是根据电影名称查找实际对象，另一种是自动排序：

@Data
public class MovieFrequencyTuple implements Comparable<MovieFrequencyTable> {
    @NonNull private final String name;
    private int frequency;
    public void incrementFrequency() {
        frequency++;
    }
    @Override public int compareTo(MovieFrequencyTuple other) {
        int c = Integer.compare(frequency, other.frequency);
        if (c != 0) return -c;
        return name.compareTo(other.name);
    }
}

有了这些：

SortedSet<MovieFrequencyTuple> frequencies = new TreeSet<>();
Map<String, MovieFrequencyTuple> movies = new HashMap<>();
public int increment(String movieName) {
    MovieFrequencyTuple tuple = movies.get(name);
    if (tuple == null) {
        tuple = new MovieFrequencyTuple(name);
        movies.put(name, tuple);
    }
    // Self-sorting data structures will just fail
    // to do the job if you modify a sorting order on
    // an object already in the collection. Thus,
    // we take it out, modify, put it back in.
    frequencies.remove(tuple);
    tuple.incrementFrequency();
    frequencies.add(tuple);
    return tuple.getFrequency();
}
public int get(String movieName) {
    MovieFrequencyTuple tuple = movies.get(movieName);
    if (tuple == null) return 0;
    return tuple.getFrequency();
}
public List<String> getTop10() {
   var out = new ArrayList<String>();
   for (MovieFrequencyTuple tuple : frequencies) {
       out.add(tuple.getName());
       if (out.size() == 10) break;
   }
   return out;
}

每一个操作都要摊销o（1）或o（logn），甚至是前10个操作。因此，如果你运行100万次“增加一部电影的频率，然后获得前10名”，n=#我们这样做的次数，那么最坏的情况是o（nlogn）性能。
注意：将lombok用于构造函数、getter等-如果您不喜欢，请让您的ide生成这些东西。

展开查看全部

赞(0）回复(0）举报 2021-07-06

我来回答

我应该用bucketsort或heapsort对包含频率的hashmap进行排序吗？

1条答案

相关问题

热门标签

最新问答