假设我有一个包含20万行诗的数据库,我想随机合并这些行,以生成语法正确且易读的3行诗。
有什么方法可以做到这一点吗?我目前正在试用language_tool_python,但它只对一般拼写和一些格式建议有帮助。我正在寻找一些东西,可以确保每一首3行诗都能正确阅读,并有语法意义。
例如,下面是一个三行数组,其中包含由我当前代码库生成的一首诗:['OVER THE SEA, THE SEA HIS ROD OBEYS', 'IS DEAD', 'BUT LET MY LAST DAYS BE MY BEST']
我想找到一个解决方案,让我检测到这首诗是不可接受的,因为它没有语法意义,有“IS DEAD”后“OVER THE SEA,THE SEA HIS ROD OBYS”.
另一个我想自动检测为无效的诗的例子:['THERE NEVER LACKS A BONE OF THE BEST', 'BUT CRUEL IS SHE', 'THEN MAY YOUR QUEEN']
我需要在客户端解决这个问题;我无法使用任何在线API即服务。
提前感谢您的任何建议!
1条答案
按热度按时间eh57zj3b1#
这是一项非常困难的任务,因为任何系统都必须理解text cohesion,才能产生连贯的输出。如果你想将这些系统应用到诗歌中,事情就变得更加复杂了,因为诗歌与传统散文(几乎从定义上来说)的唯一区别在于缺乏连贯性。引用Poetry Wikipedia page:
诗歌......是一种文学形式,它运用语言的美学和节奏特性--如音韵美学、声音象征和韵律--来唤起意义 *,以补充或取代平淡的表面意义 *。
为了让您开始寻找解决句子排序问题的基本方法,我推荐您阅读Chowdhury et al. 1(https://arxiv.org/pdf/2104.07064v2.pdf)和Ghosal et al. 2(https://arxiv.org/pdf/2109.02247.pdf)的文章,他们提供了STaCK和ReBART实现的开源实现,您可以尝试使用这些实现。但你可能会感到惊喜。
参考文献
1(https://arxiv.org/pdf/2104.07064v2.pdf) Chowdhury,S.B.R.,Brahman,F. and Chaturvedi,S.,2021.一切都有序吗?一种简单的句子排序方法. arXiv预印本arXiv:2104.07064.
2(https://arxiv.org/pdf/2109.02247.pdf)戈萨尔·D.、马琼德尔·N.、米哈尔恰·R.和茯苓·S.,2021年。堆栈:时间常识知识的句子排序。arXiv预印本:2109.02247。