从大型语言模型到大脑语言理解：探索话语理解的神经机制

随着科技的飞速发展，人工智能领域取得了令人瞩目的成就。在这其中，大型语言模型（LLMs）以其卓越的性能和广泛的应用前景，成为了当前研究的热点。然而，尽管LLMs在文本生成、语言翻译等领域展现出了惊人的能力，但它们对人类语言理解机制的模拟仍然处于初级阶段。香港理工大学的研究团队最近在这一领域取得了重要突破，他们通过引入下一句预测（NSP）任务，为理解人类话语理解机制提供了新的视角。
该研究以「Predicting the next sentence (not word) in large language models: What model-brain alignment tells us about discourse comprehension」为题，于 2024 年 5 月 23 日发布在《Science Advances》。
语言是人类交流的重要工具，而话语理解则是这一过程中的关键环节。它涉及到跨句子的意义构建，需要整合多个层面的信息以实现对话语的全面理解。传统上，LLMs主要依赖单词预测作为其核心预训练任务，但这种方式往往忽视了话语理解的多层面特性。香港理工大学的研究人员敏锐地捕捉到了这一点，他们通过引入NSP任务，试图在模型层面模拟人类对话语理解的复杂过程。
NSP任务的核心思想是，通过预测文本中的下一句来增强模型对句间关系的理解能力。这与人类在处理和理解话语时的过程非常相似。当我们阅读或聆听一段文字时，我们不仅会关注单个单词或句子的意义，还会将它们整合起来，形成一个连贯的整体。NSP任务的引入，使得LLMs能够更好地模拟这一过程，从而更加准确地理解文本的含义。
为了验证NSP任务的有效性，香港理工大学的研究团队构建了两个基于BERT的深度语言模型（DLM），并在预训练中操纵了NSP的存在。他们使用了两个功能磁共振成像（fMRI）数据集，分别强调连贯和不连接的句子关系，以测试模型在理解话语时的性能。研究结果显示，NSP预训练显著提高了模型在捕捉人类理解能力、编码上下文信息以及产生更接近人类表示方面的能力。
这一发现不仅揭示了NSP任务在模拟人类话语理解机制方面的潜力，也为解决语言神经科学中的一些问题提供了新的视角。例如，在个体差异层面，研究人员发现模型-大脑一致性与阅读时间呈负相关。这意味着，当模型与人类大脑在处理话语时表现出更高的一致性时，人们的阅读速度也会更快。这一发现对于理解阅读技能的形成和提高具有重要意义，同时也为评估阅读效率提供了新的指标。
此外，这项研究还为我们提供了关于左右脑功能分工的新见解。虽然经典左脑语言网络在词语和句子处理中发挥着关键作用，但右脑在话语理解、双语学习、韵律处理及比喻语言理解等高级语言功能中同样扮演着重要角色。这一发现进一步强调了大脑在处理和理解语言时的复杂性和多样性。
香港理工大学的研究团队通过引入NSP任务，为我们打开了一扇探索人类语言理解机制的新窗口。他们的工作不仅展示了LLMs在模拟人类语言处理方面的巨大潜力，也为解决语言神经科学中的一些问题提供了新的思路和方法。随着技术的不断进步和研究的深入，我们有理由相信，在不远的将来，我们将能够更加深入地理解人类语言处理的奥秘，并开发出更加智能、高效的人工智能系统来服务人类社会。

栏目

行业新闻

公司动态

时间

2024-06-14 08:30:26

作者

海森大数据