当通过交互式提示或微调二级语料库使用GPT-2时,模型似乎同时学习写作风格和写作主题。假设我想教GPT-2用Twitter方言(风格)写现代建筑(主题)。有没有一种方法可以向GPT-2指示输入的哪些部分与主题相关,哪些部分在风格上很重要?
093gszye1#
这将是可怕的,但我认为这仍然是一个开放的研究问题。也许有一种方法可以使用释义数据集来做到这一点(尽管它们通常具有相同的风格,只是重复措辞)
vbopmzt12#
我对这个也很感兴趣!我想词汇量和阅读水平可以作为两个指标,用来剔除那些与过去数据不同步的推文。任何人都有任何关于这个特定主题的论文风格化文本生成的参考?
ewm0tg9j3#
CycleGAN怎么样?这种技术似乎提供了对图像应用过滤器的能力,但仍然保留了原始图像以供以后检索。这表明风格(过滤器)和主题(原始图像)之间有明确的分离。从这种方法中有什么可以应用于通过GPT-2生成副本的经验吗?
3条答案
按热度按时间093gszye1#
这将是可怕的,但我认为这仍然是一个开放的研究问题。
也许有一种方法可以使用释义数据集来做到这一点(尽管它们通常具有相同的风格,只是重复措辞)
vbopmzt12#
我对这个也很感兴趣!我想词汇量和阅读水平可以作为两个指标,用来剔除那些与过去数据不同步的推文。
任何人都有任何关于这个特定主题的论文风格化文本生成的参考?
ewm0tg9j3#
CycleGAN怎么样?这种技术似乎提供了对图像应用过滤器的能力,但仍然保留了原始图像以供以后检索。这表明风格(过滤器)和主题(原始图像)之间有明确的分离。从这种方法中有什么可以应用于通过GPT-2生成副本的经验吗?