import networkx as nx
import matplotlib.pyplot as plt
G = nx.DiGraph()
def calculate_lists(user_input):
""" Calculates the number of occurences of certain character in a string."""
input_list = []
for i in user_input:
input_list.append(i)
occurence_list = []
for i in set(input_list):
occurence_list.append((i, user_input.count(i)))
sorted_by_first = sorted(occurence_list, key=lambda tup: tup[1])
sorted_list = list(reversed(sorted_by_first))
propability_list = []
for i in range(len(sorted_list)):
propability_list.append(sorted_list[i][1])
print("Input list is: ", input_list)
print("Input list is: ", input_list)
print("Occurence list: ", occurence_list)
print("Sorted list is: ", sorted_list)
print("Probility list is: ", propability_list)
return huffmann_algorithm(propability_list)
def huffmann_algorithm(prob_list):
node_list = []
while len(prob_list) != 1:
first_minimum = min(float(s) for s in prob_list)
print("First minimum", first_minimum)
prob_list.remove(first_minimum)
second_minimum = min(float(s) for s in prob_list)
print("Second minimum", second_minimum)
prob_list.remove(second_minimum)
node_list.append([first_minimum, second_minimum])
print("new value: ", first_minimum+second_minimum)
new_value = int(first_minimum+second_minimum)
prob_list.append(new_value)
print("Finished: ", prob_list)
count = 0
for i in node_list:
print(count)
print("Nodes: ", tuple(i))
G.add_node(i[0])
G.add_node(i[1])
G.add_node(i[0]+i[1])
G.add_edge(i[0], i[0]+i[1])
G.add_edge(i[1], i[0]+i[1])
print("Node list: ", node_list)
print(G.nodes())
nx.draw_networkx(G, with_labels=True, arrows=False)
plt.savefig("graph1.png")
plt.show()
def main():
user_input = str(input("Please enter a text: "))
calculate_lists(user_input)
if __name__ == "__main__":
main()
我尝试在python中实现一个版本的霍夫曼代码。但是,我不能向图中添加重复的节点。有没有一种变通方法可以用相同的文本来显示值?要理解我的意思,输入例如:aaaaabbbbcccdde该图仅显示一个标签为3的节点。
1条答案
按热度按时间nuypyhwy1#
我想你把节点和节点标签搞错了。在一个图中有重复的节点没有意义。我觉得你需要的是有重复的标签。
为了给图添加标签的概念,你可以做的是创建一个字典,将节点标识符(唯一的)Map到节点标签(可能不是唯一的):
您可以使用这些参数构建图形:
然后你可以,例如,画它:
当然(可能是最重要的),任何时候你有一个节点标识符,比如
node_id
,你可以使用labels[node_id]
来检索它的标签,我建议你总是使用节点标识符,然后在最后,当你需要打印结果时,你可以把节点标识符转换成人类可读的东西,即节点标签。根据代码的复杂程度,您可能会发现将标签附加到节点对象本身也很有用,networkx允许:
然后,您将可以访问节点属性:
这将输出: