python 当缺少键时,如何向列表的字典中添加键值对

92vpleto  于 2023-08-02  发布在  Python
关注(0)|答案(3)|浏览(114)

我有一个disctionary列表,看起来像这样:

  1. list = [{'sitemap': [{'path': 'http://test.com',
  2. 'errors': '0',
  3. 'contents': [{'type': 'web',
  4. 'submitted': '34801',
  5. 'indexed': '4656'}]}]},
  6. {'sitemap': [{'path': 'https://example.com',
  7. 'errors': '0',
  8. 'contents': [{'type': 'web', 'submitted': '2329'}]}]},
  9. {'sitemap': [{'path': 'https://fakeurl.com', 'errors': '0'}]}]

字符串
某些条目中偶尔缺少“contents”键。
这是我追求的理想输出:

  1. list = [{'sitemap': [{'path': 'http://test.com',
  2. 'errors': '0',
  3. 'contents': [{'type': 'web',
  4. 'submitted': '34801',
  5. 'indexed': '4656'}]}]},
  6. {'sitemap': [{'path': 'https://example.com',
  7. 'errors': '0',
  8. 'contents': [{'type': 'web',
  9. 'submitted': '2329',
  10. 'indexed': 'NaN'}]}]},
  11. {'sitemap': [{'path': 'https://fakeurl.com',
  12. 'errors': '0',
  13. 'contents': [{'type': 'NaN',
  14. 'submitted': 'NaN',
  15. 'indexed': 'NaN'}]}]}]


我如何识别'contents'键是否缺失,并在缺失时添加一个值为NaN的键?

o3imoua4

o3imoua41#

循环遍历列表。如果字典中没有contents键,则添加它。
contents存在时,将其与每个键的默认值列表合并。

  1. default_values = {'type': 'NaN', 'submitted': 'NaN', 'indexed': 'NaN'}
  2. for d in list_of_dicts:
  3. for m in d['sitemap']:
  4. if 'contents' not in m:
  5. m['contents'] = [default_values.copy()]
  6. else:
  7. for i, old in enumerate(m['contents']):
  8. m['contents'][i] = default_values | old

字符串

suzh9iv8

suzh9iv82#

您应该遍历'sitemap'中的每个字典,以检查'contents'是否存在。如果它不存在,则创建一个空列表,然后访问列表中的每个字典并填写默认值。如果没有字典,则复制整个默认值并将其追加到列表中:

  1. In [_]: lst = [{'sitemap': [{'path': 'http://test.com',
  2. ...: 'errors': '0',
  3. ...: 'contents': [{'type': 'web',
  4. ...: 'submitted': '34801',
  5. ...: 'indexed': '4656'}]}]},
  6. ...: {'sitemap': [{'path': 'https://example.com',
  7. ...: 'errors': '0',
  8. ...: 'contents': [{'type': 'web', 'submitted': '2329'}]}]},
  9. ...: {'sitemap': [{'path': 'https://fakeurl.com', 'errors': '0'}]}]
  10. ...:
  11. In [_]: defaults = {'type': 'NaN', 'submitted': 'NaN', 'indexed': 'NaN'}
  12. In [_]: for dct in lst:
  13. ...: for sitemap in dct['sitemap']:
  14. ...: if contents := sitemap.setdefault('contents', []):
  15. ...: for content in contents:
  16. ...: for key, value in defaults.items():
  17. ...: content.setdefault(key, value)
  18. ...: else:
  19. ...: contents.append(defaults.copy())
  20. ...:

字符串
输出量:

  1. In [_]: lst
  2. Out[_]:
  3. [{'sitemap': [{'path': 'http://test.com',
  4. 'errors': '0',
  5. 'contents': [{'type': 'web', 'submitted': '34801', 'indexed': '4656'}]}]},
  6. {'sitemap': [{'path': 'https://example.com',
  7. 'errors': '0',
  8. 'contents': [{'type': 'web', 'submitted': '2329', 'indexed': 'NaN'}]}]},
  9. {'sitemap': [{'path': 'https://fakeurl.com',
  10. 'errors': '0',
  11. 'contents': [{'type': 'NaN', 'submitted': 'NaN', 'indexed': 'NaN'}]}]}]


如果你想减少一些缩进,你可以使用stdlib中的一些工具:

  1. In [_]: from itertools import chain
  2. ...: from operator import itemgetter
  3. In [_]: for sitemap in chain.from_iterable(map(itemgetter('sitemap'), lst)):
  4. ...: if contents := sitemap.setdefault('contents', []):
  5. ...: for content in contents:
  6. ...: for key, value in defaults.items():
  7. ...: content.setdefault(key, value)
  8. ...: else:
  9. ...: contents.append(defaults.copy())
  10. ...:

展开查看全部
wxclj1h5

wxclj1h53#

我认为您可以枚举每个站点Map的“内容”,并在利用setdefault()的同时使用索引进行字典合并

给出:

  1. data = [
  2. {'sitemap': [{'path': 'http://test.com', 'errors': '0', 'contents': [{'type': 'web', 'submitted': '34801', 'indexed': '4656'}]}]},
  3. {'sitemap': [{'path': 'https://example.com', 'errors': '0', 'contents': [{'type': 'web', 'submitted': '2329'}]}]},
  4. {'sitemap': [{'path': 'https://fakeurl.com', 'errors': '0',}]}
  5. ]
  6. defaults = {'type': 'NaN', 'submitted': 'NaN', 'indexed': 'NaN'}

字符串

您可以尝试:

  1. for entry in data:
  2. for sitmap in entry['sitemap']:
  3. for index, content in enumerate(sitmap.setdefault("contents", [{}])):
  4. sitmap["contents"][index] = defaults.copy() | content
  5. print(data)


这应该会给予你一些格式:

  1. [
  2. {'sitemap': [{'path': 'http://test.com', 'errors': '0', 'contents': [{'type': 'web', 'submitted': '34801', 'indexed': '4656'}]}]},
  3. {'sitemap': [{'path': 'https://example.com', 'errors': '0', 'contents': [{'type': 'web', 'submitted': '2329', 'indexed': 'NaN'}]}]},
  4. {'sitemap': [{'path': 'https://fakeurl.com', 'errors': '0', 'contents': [{'type': 'NaN', 'submitted': 'NaN', 'indexed': 'NaN'}]}]}
  5. ]


不会赢得任何速度比赛,但我认为这是相当容易遵循。

展开查看全部

相关问题