regex 解析DeepDiff结果

eni9jsuy 于 2023-10-22 发布在其他

关注(0)|答案(4)|浏览(98)

我正在使用DeepDiff。所以我得到的结果是：

local =  [{1: {'age': 50, 'name': 'foo'}}, {2: {'age': 90, 'name': 'bar'}}, {3: {'age': 60, 'name': 'foobar'}}]
online = [{1: {'age': 50, 'name': 'foo'}}, {2: {'age': 40, 'name': 'bar'}}]
ddiff = DeepDiff(local, online)
added, updated = ddiff['iterable_item_added'], ddiff['values_changed']
added = {'root[2]': {3: {'age': 60, 'name': 'foobar'}}}
updated = {"root[1][2]['age']": {'new_value': 90, 'old_value': 40}}

现在，我想采取：

list_indexes_added = foo(added)
list_indexes_updated = foo(updated)

并获得：

list_indexes_added = [2]
list_index_updated = [(1,2,'age')]

通过这种方式，我可以操作列表local和online，并在将来更新online表。
我在考虑regexs，但也许还有其他选择。

regex

来源：https://stackoverflow.com/questions/39595934/parsing-deepdiff-result

4条答案

按热度按时间

pgvzfuti1#

一种解决方案可以是正则表达式和匹配的自定义解析。
另一种方法是，如果deepdiff的输出格式一致，则可以在对这些字符串进行正则表达式解析后使用literal_eval

from ast import literal_eval
import re

def str_diff_parse(str_diff):
    return [tuple(literal_eval(y) for y in re.findall(r"\[('?\w+'?)\]", x)) for x in str_diff]

added = {'root[2]': {3: {'age': 60, 'name': 'foobar'}}}
updated = {"root[1][2]['age']": {'new_value': 90, 'old_value': 40}}

list_indexes_added = str_diff_parse(added)
list_indexes_updated = str_diff_parse(updated)

print(list_indexes_added)
print(list_indexes_updated)
# prints
#[(2,)]
#[(1, 2, 'age')]

demo：http://ideone.com/3MhTky

还推荐dictdiffer模块，它将diff作为可消耗的python diff对象返回，可以将其修补到原始字典以获得更新的字典，反之亦然。

赞(0）回复(0）举报 2023-10-22

ltqd579y2#

这就是我所做的：

def getFromSquareBrackets(s):
    return re.findall(r"\['?([A-Za-z0-9_]+)'?\]", s)

def auxparse(e):
    try:
        e = int(e)
    except:
        pass
    return e

def castInts(l):
    return list((map(auxparse, l)))

def parseRoots(dics):
    """
        Returns pos id for list.
        Because we have formmatted [{id:{dic}}, {id:{dic}}]
    """
    values = []
    for d in dics:
        values.append(castInts(getFromSquareBrackets(d)))
    return values

所以：

parseRoots({"root[1][2]['age']": {'new_value': 90, 'old_value': 40}})
[[1, 2, 'age']]

也许有人可以改善它。

赞(0）回复(0）举报 2023-10-22

91zkwejq3#

所以，我会这样说：

import re

def foo(diff):
modded = []

for key in diff.keys():
    m = re.search('\[(.+)\]', key)
    modded.append(tuple(m.group(1).split('][')))

return modded

它将读取每个键，只提取索引（无论是数字还是字符串），然后对字符串进行切片。由于所需的输出指示一个元组，它将把索引序列分解为一个，然后返回整个索引集列表（因为diff可能有多个）。
这可以归结为一行列表解析：

import re

def foo(diff):
    return [tuple(re.search('\[(.+)\]', key).group(1).split('][')) for key in diff.keys()]

赞(0）回复(0）举报 2023-10-22

zphenhs44#

DeepDiff的作者请按照常见问题解答中的说明使用parse_path

>>> from deepdiff import parse_path
>>> parse_path("root[1][2]['age']")
[1, 2, 'age']
>>> parse_path("root[1][2]['age']", include_actions=True)
[{'element': 1, 'action': 'GET'}, {'element': 2, 'action': 'GET'}, {'element': 'age', 'action': 'GET'}]
>>>
>>> parse_path("root['joe'].age")
['joe', 'age']
>>> parse_path("root['joe'].age", include_actions=True)
[{'element': 'joe', 'action': 'GET'}, {'element': 'age', 'action': 'GETATTR'}]

赞(0）回复(0）举报 2023-10-22

我来回答

regex 解析DeepDiff结果

4条答案

相关问题

热门标签

最新问答