从心理学角度评估大型语言模型

NLP

论文

苦行僧 2023-01-05 11:42 分享

以下文章来源于mp.weixin.qq.com

来自今天的爱可可AI前沿推介

[CL] Is GPT-3 a Psychopath? Evaluating Large Language Models from a Psychological Perspective

X Li, Y Li, L Liu, L Bing, S Joty
[Alibaba Group & NTU]

从心理学角度评估大型语言模型

要点:

像GPT-3这样的大型语言模型(LLM)在Short Dark Triad人格测试中的得分比人类平均值更高，表明它们的性格相对较为负面；
使用安全度量标准微调的LLM(如InstructGPT和FLAN-T5)并不一定有更积极的性格，在Machiavellianism和Narcissism方面的得分可能比GPT-3更高；
GPT-3族经过更多指令微调的LLM在幸福感测试中得分较高；
用Big Five Inventory中正面的问答对微调LLM(如FLAN-T5)可有效改善其性格，使其在Short Dark Triad测试中的得分更高。

一句话总结：大型语言模型可能具有负面的性格，应当从心理学角度系统地评估和改进其安全性，而不仅仅是在句子层面上。

论文链接：https://arxiv.org/abs/2212.10529

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

评论列表

沙发等你来抢

去评论