谷歌Med-PaLM 2霸榜医学问答领域

谷歌IO大会上,谷歌CEO桑达尔・皮查伊(Sundar Pichai)向全世界AI开发者发布了谷歌最新的大型语言模型(LLMs)PaLM 2,作为对标OpenAI最新大模型GPT-4的竞品,PaLM 2展现出了强大的多语言和推理能力。

PaLM 2几乎在每一个指标上都超越了它的前身,但谷歌只选择强调了它认为新模型特别强大的三个领域。

首先是多语言能力。PaLM 2的训练数据加载了更多的非英语文本,现在它已经可以通过一系列不同的语言考试,达到“精通”水平。它现在的表现超过了谷歌自己的翻译引擎,并展示出了对语言、习语、隐喻及其背后的文化的微妙理解。

第二个是“推理” —— 训练数据中的数学和科学论文一直是人们关注的焦点,谷歌表示,它展示了“在逻辑、常识推理和数学方面的改进能力”。尤其是数学,作为一个整体,LLMS一直在苦苦挣扎;这不是它们的强项 —— 事实上,虽然 PaLM 2 在选定的基准测试中确实击败了GPT-4,但这里的收益似乎是渐进的,而不是革命性的。

第三个是编码,这对 LLMS 来说是一个潜力巨大的领域。Google声称 PaLM 2 在 Python 和 Javascript 方面非常出色,而且在一系列更专业的编程语言方面也非常强大。

除此之外,PaLM 2在其他专家领域上的可扩展能力也不容小觑,Med-PaLM 2就是由谷歌DeepMind的医疗健康团队在PaLM 2的基础上微调得到。可以直接给Med-PaLM 2输入一幅X光片,它会自动根据输入信息来对患者的病情进行分析和诊断。

Med-PaLM 2能够根据用户的输入来检索医学知识,并对其进行推理来回答医学问题,可以达到辅助医生完成日常报表,甚至辅助医生进行诊断的效果。

PaLM 2代表着谷歌取得了坚实的进展,使其接近OpenAI几个月来在GPT-4上取得的进展。但PaLM 2 在现实世界的严酷环境中表现如何,这才是一件值得关注的事情。