PaddleNLP [问题]:uie结果出现大量重复

mrwjdhj3  于 2个月前  发布在  其他
关注(0)|答案(5)|浏览(39)

请提出你的问题:

以下是微调后抽取的测试事件:

每经讯,据启信宝,新三板创新层公司思尔特(835532)新增专利信息,专利权人为思尔特,发明人是余协、高家铭、吴长庚、尤江南、袁燕清。专利授权日为2023年2月10日,专利名称为“一种螺杆自动分拣机构”,专利类型为中国实用新型专利,专利申请号为CN202220932799.8。
该专利摘要显示:本实用新型提供了一种螺杆自动分拣机构,包括机架,所述机架上端设置有进料口,包括可更换式分拣轮、翻转结构、V型料斗和夹取装置,其中,所述可更换式分拣轮可旋转地设置于所述进料口下方,其设置有一用于承接螺杆的凹槽;所述翻转结构设置于所述可更换式分拣轮下方,且位于所述V型料斗上方,其适于使螺杆翻转使所述螺杆带有螺纹的一端朝下;所述V型料斗适于承接从所述翻转结构落下的螺杆,并使所述螺杆垂直向下;所述夹取装置设置于所述V型料斗下方,其适于夹紧从所述V型料斗中落出的螺杆,并带动所述螺杆在机架上运动。通过该方案,实现了不同型号、不同长度的螺杆自动下料,供机器人自动搬运,以便后续的自动化操作。

以下是输出结果,可以看到多次结果重复。而且抽取不出公司实体:

[{'专利触发词': [{'end': 32,
             'probability': 0.9997298260458649,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 30,
             'text': '专利'},
            {'end': 115,
             'probability': 0.9996417475684112,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 113,
             'text': '专利'},
            {'end': 86,
             'probability': 0.9995100133495214,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 84,
             'text': '专利'},
            {'end': 118,
             'probability': 0.9993428004172742,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 116,
             'text': '专利'},
            {'end': 144,
             'probability': 0.9997839397817501,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 142,
             'text': '专利'},
            {'end': 69,
             'probability': 0.9994167546786059,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 67,
             'text': '专利'},
            {'end': 37,
             'probability': 0.9997304178317279,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 35,
             'text': '专利'},
            {'end': 104,
             'probability': 0.9995624084595534,
             'relations': {'专利': [{'end': 167,
                                   'probability': 0.8828028400393606,
                                   'start': 157,
                                   'text': '一种螺杆自动分拣机构'}],
                           '时间': [{'end': 83,
                                   'probability': 0.8605181055723534,
                                   'start': 73,
                                   'text': '2023年2月10日'}]},
             'start': 102,
             'text': '专利'}]}]
vuv7lop3

vuv7lop31#

你输入的模板是什么?我也遇到了类似的问题。由于某个实体在上下文中多次出现,三元组存在重复。

aamkag61

aamkag612#

可以尝试更改一下第一阶段的抽取目标,参考这个issue:#4664

dsf9zpds

dsf9zpds3#

这个问题也是我提的,我建议下个版本可以考虑把重复的三元组聚合一下。如果您这里没有其他方案的话,我可以先自己着手写一个聚合。

pgvzfuti

pgvzfuti4#

请问这个问题最后怎么解决呀?聚合采用什么规则?直接去重嘛?

相关问题