用大模型测试人格/抑郁/认知模式！通过游戏剧情发展测量心理特质

心理测量在精神健康、自我了解、和个人发展方面都发挥着重要的作用。

传统的心理测量方法主要依赖于参与者填写自我报告问卷，通过回忆日常生活中的行为和情绪来进行测量。

这样的测量方式虽然高效便捷，但可能引发参与者的抗拒心理，降低被测意愿。

随着大语言模型（LLM）的发展，很多研究发现LLM能够展现出稳定的人格特质，模仿人类细微的情绪与认知模式，还能辅助各种各样的社会科学*实验，为教育心理学、社会心理学、文化心理学、临床心理学、心理咨询等诸多心理学研究领域，提供了新的研究思路。

近日，清华大学的研究团队基于大语言模型的多智能体系统，提出一种创新性的心理测量范式。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

与传统自我报告问卷不同的是，该研究为每位参与者定制化生成一个可交互的叙事类型游戏，用户可自定义游戏的类型与主题。

随着游戏剧情的发展，参与者需要以第一人称视角，根据各种情节做出不同的选择，从而影响剧情的进展。通过研究参与者在游戏关键时刻的选择，可以评估他们的心理特征。

△自我报告问卷的心理学测量范式（左）与交互叙事类游戏的心理测量范式（右）对比

该研究的贡献主要体现在三个方面：

提出一种新的心理学测量范式，将传统问卷转化成基于游戏的交互测量；在保证心理测量信度和效度的基础上，提升参与者的沉浸感，改善被测体验。
为了实现游戏化的测量，该研究提出一种基于大语言模型的多智能体交互框架，名为PsychoGAT （Psychological Game AgenTs），确保了心理学测试场景的泛化性，与不同游戏设置下测量的鲁棒性。
通过自动化*评估与真人评估，在MBTI人格测试，PHQ-9抑郁测量，认知思维陷阱测试等任务上，该研究在心理测量学统计学指标和用户体验感指标上均展现出了显著的优越性。

接下来，我们一起来看看该研究的细节。

PsychoGAT长啥样？

△PsychoGAT框架示意图

智能体交互流程：

给定一个传统的心理学测试问卷，参与者自定义游戏类型和主题，然后由游戏设计师（Game Designer）智能体给出整体的游戏设计大纲。

然后，游戏管理员（Game Controller）智能体生成一个具体的游戏情节，在这个过程中评论员（Critic）智能体会对管理员生成内容进行多轮的审核与优化；优化完成后的游戏情节会被展现给参与者，参与者做出相应的选择后，管理员基于此选择推动剧情发展，按照这样的交互过程循环。

各智能体职能详述：

游戏设计师（Game Designer）：利用CoT技术，生成第一人称叙事游戏的大纲，并保证这个故事线中所包含的情景，能够使得参与者表现出当前测量的心理特质。

与此同时，将标准的心理学自我报告问卷，根据当前游戏故事线进行改编，使两者的融合更为自然流畅。

游戏管理员（Game Controller）：将改编后的问卷，按照游戏的故事线，依次进行实例化，变成故事的情节节点，并提供可能的选项，供参与者进行选择。

与此同时，游戏管理员将参与者的选择返回给游戏环境，并基于参与者的选择，控制游戏的剧情走向。为了实现游戏情节的连贯性，管理员智能体采用“记忆更新”机制。

评论员（Critic）：旨在对游戏管理员的生成内容进行审核与优化。

主要针对以下三个问题：

1）优化一致性：随着游戏剧情推进，长文本问题会变得更加严重，使得“记忆更新”机制也无法完全保证情节一致性。

2）确保无偏性：参与者的选择会影响游戏情节的发展，但在参与者不做出选择之前，管理员不应该预设情节走向，即便之前的选择中参与者体现出了明显的倾向性。

3）改正漏缺项：对管理员生成的游戏情节进行细节审核，检查其是否具备基础的游戏沉浸感。

SCISPACE

AI论文研究助手，探索和解释论文的平台

65 查看详情 SCISPACE

实验及结果

△三种常见心理学测量范式的对比：传统问卷，心理学家会谈，以及该研究提出的游戏化测评。

此处提到的均为基于AI的自动化测量，特别的，心理学家会谈，指目前与大语言模型结合的，由大语言模型扮演心理学家的会谈范式。

实验阶段，研究人员选择了三个常见的心理学测量任务：MBTI人格测试中的外倾性，PHQ-9抑郁检测，以及CBT疗法中前期的认知扭曲检测。

首先，研究人员和成熟的传统心理学问卷进行对比，旨在检验该研究的心理测量信度和效度。进一步，和其他三种自动化测量方法进行对比，检验不同测量方法的用户体验。

研究人员首先使用GPT-4模拟被测者，在不同的测量方法上记录测量过程与测量结果。这些测量记录被用于计算后续心理测量学信效度指标，以及用户体验感指标。

评价指标有两个：信效度指标和用户体验感指标。

信效度指标：心理测量学上，评价一个测量工具是否具有科学性，一般从信度（reliability）和效度（validity）两个维度进行验证。

在该研究中，信度的指标选择了两个统计学量来衡量内部一致性：Cronbach’s Alpha和Guttman’s Lambda 6；效度的指标采用皮尔森系数，分别衡量聚合效度（convergent validity）和区分效度（discriminant validity）。

用户体验感指标，人工评估的指标包括：

1）一致性（Coherence, CH）：内容逻辑是否连贯；
2）交互性（Interactivity, IA）：是否对用户的选择有恰当且无偏的回应；
3）趣味性（Interest, INT）：测量过程是否有趣；
4）沉浸感（Immersion, IM）：测量过程是否让参与者沉浸代入；
5）满意度（Satisfaction, ST）：整体测量过程的满意度。

下面是实验结果。

首先研究人员检验了该研究提出的PsychoGAT能够作为一个合格的心理学测量工具，结果如下表所示。

△PsychoGAT的信效度检验结果（+通过，++良好，+++优秀）

进一步，研究人员对比了不同心理测量范式的用户体验感，该研究提出的游戏化测评在交互性、趣味性和沉浸感上都显著优于其他方法：

△PsychoGAT的用户体验感结果，以及其他对比方法的相应结果

为了确保人工评估的有效性，研究人员计算了人工评估结果，在PsychoGAT各指标优于其他方法上的评估一致性：

△PsychoGAT的用户体验感指标由于对比方法在人工评估上的一致性

为了对PsychoGAT做进一步分析，研究人员首先检验了不同游戏场景下，游戏化测量的信效度具有很好鲁棒性：

△PsychoGAT在不同游戏场景下测量信效度的鲁棒性

接着，探究了每一个智能体在PsychoGAT中发挥的作用：

△PsychoGAT不同智能体的作用

最后，为了直观呈现PsychoGAT的游戏生成内容，研究人员用词云可视化了人格外倾性测试和抑郁测试：

△PsychoGAT在外倾性测量和抑郁测量的游戏场景生成可视化。

外倾性测试的内容主要集中在社交场景，而抑郁测试倾向于个人思维和情绪。

更多研究细节，可参考原论文。

论文链接：https://www.php.cn/link/4bcd537b6c034e297f0030cf08887426

以上就是用大模型测试人格/抑郁/认知模式！通过游戏剧情发展测量心理特质的详细内容，更多请关注其它相关文章！

# 自定义 # 营销号宝推广时间设置 # 安康市网站推广方法 # 南宁专注网站建设优化 # 陇南口碑推广营销怎么做 # 磐石商城网站建设 # 平山网站快照优化哪家好 # 合肥哪里有seo # 泰安网站建设重点 # seo英语翻译推广软件 # 汽车网站如何推广 # 满意度 # 化生 # 模型 # 三种 # 出了 # 丰田 # 测量方法 # 中国科学院 # 心理测量 # 测量学 # design # designer # follow # 研究

相关栏目：【 Google疑问12 】【 Facebook疑问10 】【优化推广96088 】【技术知识133117 】【 IDC资讯59369 】【网络运营7196 】【 IT资讯61894 】

2024-03-13

Notion AI怎么写笔记 Notion AI辅助写作及自动摘要生成技巧【教学】 AI一键生成高质量论文大纲 Claude帮你改写和润色文章 Claude写作风格优化技巧怎么用ai创作绘本 AI儿童故事与插画自动生成【秘籍】去哪旅行ai抢票助手怎么查看抢票历史_去哪旅行ai抢票助手历史记录查询与筛选【教程】如何用AI一键去除图片背景？AI自动抠图去底最强工具【实测】 DeepSeek数学建模应用指南 DeepSeek解决复杂问题技巧如何用AI一键扩图补全背景？Photoshop AI生成填充使用技巧【教程】 DeepSeek辅助撰写技术文档方法 DeepSeek开发者必备技巧文心一言官方网站在线入口文心一言在线版使用地址 Kimi国内访问入口_Kimi智能助手网页版链接直达如何用AI生成室内设计效果图？AI装修设计灵感生成指南【教程】 AI一键生成社交媒体自动回复蚂蚁阿福官网网页版入口_电脑端使用医保与健康服务如何用AI一键去视频水印 AI视频无痕去水印软件使用方法【教程】 Claude帮你解读晦涩的学术理论 Claude知识学习助手 Jasper AI怎么写社交媒体帖子 Jasper AI社媒内容创作【攻略】 DeepSeek长代码项目理解与分析 DeepSeek代码库学习方法 DeepSeek进行科学计算教程 DeepSeek物理建模与* AI一键生成短视频分镜头脚本

了解您产品搜索量及市场趋势，制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求，1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商，作为谷歌推广与Facebook广告全球合作伙伴，聚焦外贸企业出海痛点，以数字化营销为核心，提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持，打破传统外贸获客壁垒，助力企业高效开拓全球市场，成为中小企业出海的可靠合作伙伴。