nlp.js Amend sentiment.md

ntjbwcob  于 1个月前  发布在  其他
关注(0)|答案(3)|浏览(42)

您的功能请求是否与问题相关?请描述。

一个清晰简洁的问题描述。例如:当我[...]时,总是感到沮丧。
目前在处理后没有绝对最小和最大情感分数的参考。

描述您希望实现的功能

一个清晰简洁的描述,说明您希望发生什么。
您能提供sentiment.md文件中的情感刻度吗?例如:-1 -> 1

描述您考虑过的替代方案

一个清晰简洁的描述,说明您考虑过的其他解决方案或功能。

其他上下文

在此功能请求中添加任何其他上下文或屏幕截图。

gab6jxml

gab6jxml1#

情感分析是通过词典完成的,每种语言都有三种可能的词典类型:

  • AFINN:词典中的每个词都有一个介于-5(非常负面)和5(非常正面)之间的值
  • Senticon:词典中的每个词都有一个介于-1(非常负面)和1(非常正面)之间的值
  • Pattern:词典中的每个词都有一个介于-1(非常负面)和1(非常正面)之间的值

有一张表格列出了每种语言可用的词典:
https://github.com/axa-group/nlp.js/blob/master/docs/v4/language-support.md#sentiment-analysis
在情感分析中,通常会将分类分为三类:负面、中性和平。因此,如果分数是负数,那么情感就是负面的;如果分数是0,那么情感就是中性的;如果分数是正数,那么情感就是正面的。
情感分析的结果表示属性类型中使用的词典类型。
情感分析的响应示例:

{ score: 0.313,
   numWords: 3,
   numHits: 1,
   comparative: 0.10433333333333333,
   type: 'senticon',
   language: 'en' }
  • score将包含使用词典计算出的句子的总分
  • numWords将包含句子中的单词数量
  • numHits将包含句子中在词典字典中的单词数量
  • comparative将包含score / numWords
  • type将包含'afinn','senticon'或'pattern'
  • language:语言

为了更好地理解AFINN,我推荐观看Finn Årup Nielsen原始论文的讲座:
https://arxiv.org/abs/1103.2903
为了更好地了解不同词典情感分析方法之间的准确性,
https://www.researchgate.net/publication/343473213_Evaluating_the_performance_of_the_most_important_Lexicons_used_to_Sentiment_analysis_and_opinions_Mining
在NLP.js中有两个主要改进:否定词和计算词干。
还有一篇分析情感分析改进的文章,并非所有都用于NLP.js:
https://www.sciencedirect.com/science/article/pii/S2090447921003105
希望你喜欢阅读

dgenwo3n

dgenwo3n2#

这是我遇到的问题:
{
情感: {
分数: 1.563,
单词数: 20,
命中次数: 7,
平均值: 0.07815,
类型: 'senticon',
区域设置: 'en',
投票: '正面'
}
}
Senticon返回的分数大于1。

gajydyqb

gajydyqb3#

在我之前的评论中:"score将包含使用词典计算的句子的总分数"
Total = 几个之和
numHits为7,表示你的句子中有7个词在词典中,而numWords为20,意味着有13个词不在词典中。
1.563是这7个词的总分数。

相关问题