情感分析的终极形态:全景式细粒度多模态对话情感分析基准PanoSent
来源: 时间:2024-10-12 12:53
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com罗盟,本工作的第一作者。新加坡国立大学(NUS)人工智能专业准博士生,本科毕业于武汉大学。主要研究方向为多模态大语言模型和 Social AI、Human-eccentric AI。
情感计算一直是自然语言处理等相关领域的一个火热的研究课题,最近的进展包括细粒度情感分析(ABSA)、多模态情感分析等等。新加坡国立大学联合武汉大学、奥克兰大学、新加坡科技设计大学、南洋理工大学团队近期在这个方向上迈出了重要的一步,探索了情感分析的终极形态,提出了 PanoSent —— 一个全景式细粒度多模态对话情感分析基准。PanoSent 覆盖了全面的细粒度、多模态、丰富场景和认知导向的情感分析任务,将为情感计算方向开辟新的篇章,并引领未来的研究方向。该工作被 ACM MM 2024 录用为 Oral paper。

尽管情感分析领域已取得显著进展,目前的研究定义仍然不够全面,无法提供一个完整且详细的情感画面,这主要是由于以下几个问题。
首先,缺乏一个综合定义,将细粒度分析、多模态和对话场景结合起来。在现实生活应用中,如社交媒体和论坛上,这些方面往往需要同时考虑。然而,现有研究要么在多模态情感分析定义中缺乏详细分析,要么在对话 ABSA 中缺失多模态建模。最完整的基于文本的 ABSA 定义仍然无法完全涵盖或细致划分情感元素的粒度。其次,当前的情感分析定义只考虑识别固定的静态情感极性,忽略了情感随时间变化或因各种因素变化的动态性。例如,社交媒体对话中的用户最初的观点,可能会在接触到其他发言者的新信息或不同观点后发生变化。第三,也是最关键的,现有工作没有彻底分析或识别情感背后的因果原因和意图。人类情感的激发和变化有特定的触发因素,未能从认知角度理解情感背后的因果逻辑意味着尚未根本实现人类级别的情感智能。总的来说,提供一个更全面的情感分析定义可能会显著增强这项任务的实用价值,例如,开发更智能的语音助手、更好的临床诊断和治疗辅助以及更具人性化的客户服务系统。为填补这些空白,本文提出了一种全新的全景式细粒度多模态对话情感分析方法,旨在提供一个更全面的 ABSA 定义,包括全景情感六元组提取(子任务一)和情感翻转分析(子任务二)。如图 1 所示,本文关注的是涵盖日常生活中最常见的四种情感表达模态的对话场景。一方面,作者将当前的 ABSA 四元组提取定义扩展到六元组提取,包括持有者、目标、方面、观点、情感和理由,全面覆盖更细粒度的情感元素,提供情感的全景视图。另一方面,作者进一步定义了一个子任务,监控同一持有者在对话中针对同一目标和方面的情感动态变化,并识别导致情感翻转的触发因素。在六元组提取和情感变化识别中,作者强调辨别潜在的因果逻辑与触发因素,力求不仅掌握方法,还要理解背后的原因,并从认知角度进行分析。
与现有的 ABSA 任务相比,本文提出的新任务提出了更大的挑战,例如需要理解复杂的对话情境并灵活地从各种模态中提取特征,尤其是在认知层面识别因果原因。考虑到多模态大型语言模型(MLLMs)在跨多模态的强大语义理解方面最近取得的巨大成功,作者构建了一个主干 MLLM 系统,Sentica,用于编码和理解多模态对话内容。受人类情感分析过程的启发,作者进一步开发了一个情感链推理框架(CoS),用于高效地解决任务,该框架基于思维链的思想,将任务分解为从简单到复杂的四个渐进推理步骤。该系统能够更有效地提取情感六元组的元素,并逐步识别情感翻转,同时引导出相应的理由和触发因素。基于释义的验证(PpV)机制增强了 CoS 推理过程的稳固性。全景式细粒度多模态对话情感分析基准:PanoSent任务建模PanoSent 包括两个关键任务,具体可参见图 1 的可视化展示。全景式情感六元组抽取:从多轮、多方、多模态对话中识别情感持有者、目标、方面、观点、情感及其原因。情感翻转分析:检测对话中情感的动态变化及其背后的因果关系。PanoSent 基准数据集研究团队构建了一个包含 10,000 个对话的大规模高质量数据集 PanoSent,数据来自现实世界的多样化来源,情感六元组元素经过手动注释,并借助 GPT-4 和多模态检索进行扩展。通过严格的人工检查和交叉验证,确保数据集的高质量。PanoSent 数据集首次引入了隐式情感元素和情感背后的认知原因,覆盖最全面的细粒度情感元素,适用于多模态、多语言和多场景的应用。




步骤 3:“情感 - 理由” 挖掘基于已识别的四元组,分析与每个观点相关的情感并识别其背后的理由。最终输出为六元组,全面展现情感表达及其背后的因果逻辑。
步骤 4:“情感翻转触发器” 分类在识别出所有六元组后,最后一步是检测情感的翻转,即从初始情感到翻转情感的变化,对导致情感翻转的触发因素进行分类。输出应为包含上述情感元素的六元组或 “None” (如果没有情感翻转)






验证多模态信息的重要性研究团队深入分析了多模态信息在情感分析中的作用,发现其不仅是对文本信息的补充,还在六元组元素的判断中起到关键作用。实验结果显示,移除任何模态信号都会导致性能下降,尤其是图像信息的缺失对性能的影响最大。这表明,多模态信息在任务中不可或缺,对提高模型的识别精度至关重要。
验证 PpV 机制的合理性作者验证了基于复述的验证机制(PpV)的有效性。实验表明,通过 LLM 复述和直接验证,PpV 机制能够确保结构化数据与对话上下文之间的语义一致性,其性能优于仅依赖直接验证或不进行验证的方式。此外,使用固定模板复述结构化元组比依赖 LLM 复述更为可靠,这进一步增强了情感分析的稳健性。



相关知识
语音情感识别调研
顶刊TPAMI 2022!基于不同数据模态的行为识别:最新综述
基于AI的宠物情绪识别与行为分析
多模态传感器融合提升宠物训练效率.docx
AI狗语翻译器:揭秘跨物种沟通新科技,助力人宠心灵相通
给多多的关爱:宠物情感需求分析
宠物饲养的心理学研究宠物与主人的情感互动分析
水彩画中水的艺术表现力探析:形态、纹理、色彩、光影与情感
1小时搭建“汪汪宠物狗”公司的N种模态文档的RAG智能对话机器人
竞赛 | CVPR 2019 十大细粒度视觉识别挑战赛来袭,谷歌发来参赛征集令!
网址: 情感分析的终极形态:全景式细粒度多模态对话情感分析基准PanoSent https://www.mcbbbk.com/newsview368838.html
| 上一篇: QQ群机器人宠物世界插件:让虚拟 |
下一篇: 北京大学情感与认知智能机器人实验 |
推荐分享
- 1养玉米蛇的危害 28694
- 2狗交配为什么会锁住?从狗狗生 7180
- 3我的狗老公李淑敏33——如何 6236
- 4豆柴犬为什么不建议养?可爱的 4637
- 5南京宠物粮食薄荷饼宠物食品包 4563
- 6中国境内禁养的十大鸟种,你知 4429
- 7湖南隆飞尔动物药业有限公司宠 4259
- 8自制狗狗辅食:棉花面纱犬的美 4257
- 9家养水獭多少钱一只正常 4212
- 10广州哪里卖宠物猫狗的选择性多 4122
分享热点排名
分享热点
