用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质


心理测量在精神健康、自我了解、和个人发展方面都发挥着重要的作用。

传统的心理测量方法主要依赖于参与者填写自我报告问卷,通过回忆日常生活中的行为和情绪来进行测量。

这样的测量方式虽然高效便捷,但可能引发参与者的抗拒心理,降低被测意愿。

随着大语言模型(LLM)的发展,很多研究发现LLM能够展现出稳定的人格特质,模仿人类细微的情绪与认知模式,还能辅助各种各样的社会科学*实验,为教育心理学、社会心理学、文化心理学、临床心理学、心理咨询等诸多心理学研究领域,提供了新的研究思路。

近日,清华大学的研究团队基于大语言模型的多智能体系统,提出一种创新性的心理测量范式

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

与传统自我报告问卷不同的是,该研究为每位参与者定制化生成一个可交互的叙事类型游戏,用户可自定义游戏的类型与主题

随着游戏剧情的发展,参与者需要以第一人称视角,根据各种情节做出不同的选择,从而影响剧情的进展。通过研究参与者在游戏关键时刻的选择,可以评估他们的心理特征。

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

△自我报告问卷的心理学测量范式(左)与交互叙事类游戏的心理测量范式(右)对比

该研究的贡献主要体现在三个方面:

  • 提出一种新的心理学测量范式,将传统问卷转化成基于游戏的交互测量;在保证心理测量信度和效度的基础上,提升参与者的沉浸感,改善被测体验。
  • 为了实现游戏化的测量,该研究提出一种基于大语言模型的多智能体交互框架,名为PsychoGAT (Psychological Game AgenTs),确保了心理学测试场景的泛化性,与不同游戏设置下测量的鲁棒性。
  • 通过自动化*评估与真人评估,在MBTI人格测试,PHQ-9抑郁测量,认知思维陷阱测试等任务上,该研究在心理测量学统计学指标和用户体验感指标上均展现出了显著的优越性。

接下来,我们一起来看看该研究的细节。

PsychoGAT长啥样?

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

△PsychoGAT框架示意图

智能体交互流程:

给定一个传统的心理学测试问卷,参与者自定义游戏类型和主题,然后由游戏设计师(Game Designer)智能体给出整体的游戏设计大纲。

然后,游戏管理员(Game Controller)智能体生成一个具体的游戏情节,在这个过程中评论员(Critic)智能体会对管理员生成内容进行多轮的审核与优化;优化完成后的游戏情节会被展现给参与者,参与者做出相应的选择后,管理员基于此选择推动剧情发展,按照这样的交互过程循环。

各智能体职能详述:

  • 游戏设计师(Game Designer):利用CoT技术,生成第一人称叙事游戏的大纲,并保证这个故事线中所包含的情景,能够使得参与者表现出当前测量的心理特质。

与此同时,将标准的心理学自我报告问卷,根据当前游戏故事线进行改编,使两者的融合更为自然流畅。

  • 游戏管理员(Game Controller):将改编后的问卷,按照游戏的故事线,依次进行实例化,变成故事的情节节点,并提供可能的选项,供参与者进行选择。

与此同时,游戏管理员将参与者的选择返回给游戏环境,并基于参与者的选择,控制游戏的剧情走向。为了实现游戏情节的连贯性,管理员智能体采用“记忆更新”机制。

  • 评论员(Critic):旨在对游戏管理员的生成内容进行审核与优化。

主要针对以下三个问题:

1)优化一致性:随着游戏剧情推进,长文本问题会变得更加严重,使得“记忆更新”机制也无法完全保证情节一致性。

2)确保无偏性:参与者的选择会影响游戏情节的发展,但在参与者不做出选择之前,管理员不应该预设情节走向,即便之前的选择中参与者体现出了明显的倾向性。

3)改正漏缺项:对管理员生成的游戏情节进行细节审核,检查其是否具备基础的游戏沉浸感。

SCISPACE SCISPACE

AI论文研究助手,探索和解释论文的平台

SCISPACE 65 查看详情 SCISPACE

实验及结果

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

△三种常见心理学测量范式的对比:传统问卷,心理学家会谈,以及该研究提出的游戏化测评。

此处提到的均为基于AI的自动化测量,特别的,心理学家会谈,指目前与大语言模型结合的,由大语言模型扮演心理学家的会谈范式。

实验阶段,研究人员选择了三个常见的心理学测量任务:MBTI人格测试中的外倾性,PHQ-9抑郁检测,以及CBT疗法中前期的认知扭曲检测。

首先,研究人员和成熟的传统心理学问卷进行对比,旨在检验该研究的心理测量信度和效度。进一步,和其他三种自动化测量方法进行对比,检验不同测量方法的用户体验。

研究人员首先使用GPT-4模拟被测者,在不同的测量方法上记录测量过程与测量结果。这些测量记录被用于计算后续心理测量学信效度指标,以及用户体验感指标。

评价指标有两个:信效度指标和用户体验感指标。

  • 信效度指标:心理测量学上,评价一个测量工具是否具有科学性,一般从信度(reliability)和效度(validity)两个维度进行验证。

在该研究中,信度的指标选择了两个统计学量来衡量内部一致性:Cronbach’s Alpha和Guttman’s Lambda 6;效度的指标采用皮尔森系数,分别衡量聚合效度(convergent validity)和区分效度 (discriminant validity)

  • 用户体验感指标,人工评估的指标包括:

1)一致性(Coherence, CH):内容逻辑是否连贯;
2)交互性(Interactivity, IA):是否对用户的选择有恰当且无偏的回应;
3)趣味性(Interest, INT):测量过程是否有趣;
4)沉浸感(Immersion, IM):测量过程是否让参与者沉浸代入;
5)满意度(Satisfaction, ST):整体测量过程的满意度。

下面是实验结果。

首先研究人员检验了该研究提出的PsychoGAT能够作为一个合格的心理学测量工具,结果如下表所示。

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质
△PsychoGAT的信效度检验结果(+通过,++良好,+++优秀)

进一步,研究人员对比了不同心理测量范式的用户体验感,该研究提出的游戏化测评在交互性、趣味性和沉浸感上都显著优于其他方法:

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

△PsychoGAT的用户体验感结果,以及其他对比方法的相应结果

为了确保人工评估的有效性,研究人员计算了人工评估结果,在PsychoGAT各指标优于其他方法上的评估一致性:

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质
△PsychoGAT的用户体验感指标由于对比方法在人工评估上的一致性

为了对PsychoGAT做进一步分析,研究人员首先检验了不同游戏场景下,游戏化测量的信效度具有很好鲁棒性:

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

△PsychoGAT在不同游戏场景下测量信效度的鲁棒性

接着,探究了每一个智能体在PsychoGAT中发挥的作用:

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

△PsychoGAT不同智能体的作用

最后,为了直观呈现PsychoGAT的游戏生成内容,研究人员用词云可视化了人格外倾性测试和抑郁测试:

用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质

△PsychoGAT在外倾性测量和抑郁测量的游戏场景生成可视化。

外倾性测试的内容主要集中在社交场景,而抑郁测试倾向于个人思维和情绪。

更多研究细节,可参考原论文。

论文链接:https://www.php.cn/link/4bcd537b6c034e297f0030cf08887426

以上就是用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质的详细内容,更多请关注其它相关文章!


# 自定义  # 营销号宝推广时间设置  # 安康市网站推广方法  # 南宁专注网站建设优化  # 陇南口碑推广营销怎么做  # 磐石商城网站建设  # 平山网站快照优化哪家好  # 合肥哪里有seo  # 泰安网站建设重点  # seo英语翻译推广软件  # 汽车网站如何推广  # 满意度  # 化生  # 模型  # 三种  # 出了  # 丰田  # 测量方法  # 中国科学院  # 心理测量  # 测量学  # design  # designer  # follow  # 研究 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 绿联发布笑脸屏幕显示充电状态的30W/65W Q湃机器人充电器  看懂AI,找到增长新势能 | 笔记侠AI峰会等你来  亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资  大厂出品!这个AI网站太顶了,所有功能免费用  人工智能行业急缺人 AI人才年薪能达近42万元  AI与5G的强强联合:唤醒数字时代的无尽潜能  马斯克回应“人工智能让一切变得更好”:我们已经是半机器人了  移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速  OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格  可按用户语气自动回复消息,Zoom 推出基于生成式 AI 的新功能  探索AI前沿理念 2025全球人工智能技术大会在杭州开幕  配 3D 机器人头像,谷歌展示全新安卓 LOGO  视觉中国推出AI灵感绘图功能  人手一部「*」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友  Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代  纪录片 《寻找人工智能》全集1080P超清  2025VR&AR显示技术峰会视频解析: 歌尔光学展示最新一代VR/AR光学模组  DragGAN开源三天Star量23k,这又来一个DragDiffusion  360发布认知型通用大模型“360智脑4.0” 全面接入360全家桶  日入400万,第一批AI骗子已上岗  印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等  黄仁勋:5年前,我们对AI抱有巨大期望  中国联通发布图文AI大模型,可实现以文生图、视频剪辑  掌阅科技申请阅爱聊商标 掌阅科技申请AI相关商标  美图吴欣鸿:希望更多人用上AI时代的影像生产力工具  人工智能在项目管理中的作用  中国电信AI能力通过国家级金融领域权威认证并荣膺AI国际头部竞赛冠军  工信部信通院发布《2025大模型和AIGC产业图谱》 360智脑覆盖全产业链  生成式AI对云运维的3大挑战  SnapFusion技术大幅提升AI图像生成速度  “具身智能”引爆机器人产业,看绝影Lite3/X20四足机器人有何特别之处?  食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心  比尔盖茨:AI确实存在风险,但可控  午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|  AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景  普林斯顿大学推出 Infinigen AI 模型,生成真实自然环境 3D 场景  利用AI技术更好地发展农村电商  眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  25个AI智能体源码现已公开,灵感来自斯坦福的「虚拟小镇」和《西部世界》  NVIDIA垄断AI市场90%份额:AMD性能追上80% 软件太不能打  导演郭帆:人工智能应用可能会影响《流浪地球 3》的创作开发  VR健身应用《FitXR》将取消Quest 1端会员服务  AI无法对传统文化符号进行解构和创新  如何用AI开创智慧能源新时代?固德威正让能源“通人性”!  北京市通用人工智能产业创新伙伴计划名单公布,京东科技入选“算力伙伴”  小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学  讯飞星火大模型实现升级 助力通用人工智能人才培养  磐镭发布全新 GeForce RTX 4080 ARMOUR 显卡,售价为 9499 元  利亚德加码AI战略,与光年无限图灵机器人全面开展AI研发业务合作 

 2024-03-13

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.