信息熵编码问题

x33g5p2x  于2022-06-20 转载在 其他  
字(0.9k)|赞(0)|评价(0)|浏览(460)

一 原题链接

1521 -- Entropy

二 题目理解

输入: 大写字符串+下划线的集合,下划线代表空格。

输出: ASCII 编码所需二进制长度,哈夫曼编码后长度, 压缩率(前者除以后者),遇到 END 终结。

输入样例
AAAAABCD

THE_CAT_IN_THE_HAT

END

输出样例

64 13 4.9

144 51 2.8

三 算法设计

最佳无前缀可变长度编码就是哈夫曼编码。首先根据字符串统计每个字符出现的频率,然后按照频率构造哈夫曼树,计算总的编码长度。

四 代码

  1. package tree;
  2. import java.util.PriorityQueue;
  3. import java.util.Scanner;
  4. public class poj1521 {
  5. public static void main(String[] args) {
  6. Scanner scanner = new Scanner(System.in);
  7. while (true) {
  8. int a[] = new int[100];
  9. String s = scanner.next();
  10. if (s.equals("END")) {
  11. return;
  12. }
  13. int n = s.length();
  14. for (int i = 0; i < n; i++)
  15. if (s.charAt(i) == '_')
  16. a[26]++;
  17. else
  18. a[s.charAt(i) - 'A']++;
  19. PriorityQueue<Integer> q = new PriorityQueue<>();
  20. for (int i = 0; i <= 26; i++)
  21. if (a[i] != 0)
  22. q.add(a[i]);
  23. int ans = n;
  24. while (q.size() > 2) {
  25. int t, t1, t2;
  26. t1 = q.peek();
  27. q.poll();
  28. t2 = q.peek();
  29. q.poll();
  30. t = t1 + t2;
  31. ans += t;
  32. q.add(t);
  33. }
  34. System.out.println("ASCII编码:" + (n * 8));
  35. System.out.println("熵编码:" + ans);
  36. System.out.println("压缩比:" + (double) n * 8 / ans);
  37. }
  38. }
  39. }

五 测试结果

绿色为输入,白色为输出。

相关文章