“每个分区中可以有许多键(及其相关值),但是任何给定键的记录都在一个分区中。”这是著名的hadoop教科书中的一行。我不明白它的第二部分的全部意思,它说“但是任何给定键的记录都在一个分区中。”这是不是意味着一个键的所有记录都应该在一个分区或其他什么地方。
slhcrj9b1#
但是任何给定密钥的记录都在一个分区中如果只有一个键,则该键及其关联值必须位于单个分区上。有时值可能相当大。但这是对值大小的限制。它必须小到可以装在一个隔板上。注意,键和值上可能还有其他常量,这取决于后端存储所使用的内容,例如,可能需要一个键-值对才能装入节点的内存。
1条答案
按热度按时间slhcrj9b1#
但是任何给定密钥的记录都在一个分区中
如果只有一个键,则该键及其关联值必须位于单个分区上。有时值可能相当大。但这是对值大小的限制。它必须小到可以装在一个隔板上。
注意,键和值上可能还有其他常量,这取决于后端存储所使用的内容,例如,可能需要一个键-值对才能装入节点的内存。