keras NLP模型的参数是如何产生的？

41zrol4v 于 2023-08-06 发布在其他

关注(0)|答案(1)|浏览(104)

我开始使用Tensorflow研究NLP，但很难理解嵌入层上的参数分布是如何发生的。
这是我的基本NLP模型总结。

的数据
我无法理解嵌入层如何具有1.28M参数，因为将15个令牌连接到128个值的1个向量不应该那么多。
还是我看错了？

keras

来源：https://stackoverflow.com/questions/76744592/how-the-parameters-of-nlp-models-are-produced

1条答案

按热度按时间

mgdq6dx11#

简短回答：
嵌入层：嵌入层中的参数数量由vocabulary_size * embedding_dimension给出。如果你的词汇量为10，000个单词==> 10，000 * 128 = 1，280，000
致密层：密集层中的参数数量由(input_dimension + 1) * units给出，其中+1表示每个单元的 bias 项。

V * 128 + 387 = 1,280,129*

我希望这能澄清这一点。如果你想要更多……

赞(0）回复(0）举报 2023-08-06

我来回答

keras NLP模型的参数是如何产生的？

1条答案

相关问题

热门标签

最新问答