GPT-4再燃热点,满分第一名通过大厂模拟面试

2019年,微软用10亿美元砸进 OpenAI,联合开发新的 Azure AI 超级计算技术,而 OpenAI 也将把它的服务转移到 Azure 上运行,最终目标是向通用人工智能(Artificial General Intelligence,AGI)技术发起进攻。
近日,微软研究团队用154页的论文报告内容给出了解答——GPT-4语言模型可以被视为 AGI 的早期版本!

所谓 AGI,仅通过维基百科的解释——「AGI 是具备与人类同等智能、或超越人类的人工智能,能表现正常人类所具有的所有智能行为」。


3月15日,OpenAI研发的多模态预训练大模型GPT-4发布,之前的热度还来不及冷却,就被人工智能的迭代升级速度追上了。比起ChatGPT,GPT-4拥有更强大的识图能力,文字输入的上限提升到了2.5万字,它能更加流畅准确地回答用户的问题,能写歌词,写创意文本,且风格多变。
研究发现GPT-4除了精通语言,还能无需特别提示解决数学、编程、视觉、医学、法律、心理和更多领域的新任务和难任务。
更为关键的是,GPT-4在这些方面表现大幅超越ChatGPT等之前模型,并在所有这些任务上惊人地接近人类水平 ,也就是摸到了AGI的门槛。
一个最突出的例子,GPT-4满分通过了LeetCode上的亚马逊公司模拟面试,超越所有参与测试的人类,可以被聘用为软件工程师。
从3.5版本迭代到4.0版本,ChatGPT仿佛经历了质的飞跃。
它从司法考试排名倒数10%、SAT数学考试590分,生物奥林匹克竞赛排名前69%,发展到了司法考试排名前10%、SAT数学考试700分、生物奥林匹克竞赛排名前1%。它的英文准确度提升到85.5%,中文准确性提升到80.1%;事实准确性大幅提升,就像一个成绩突飞猛进的“学霸”。
如果一个月前,社交媒体上许多人对于失业的担忧,更多还是一种调侃和玩笑,那么短短一个月之后,实验数据证明了这种可能性并不只是玩笑。
研究人员在论文中写道,“我们声称 GPT-4代表了 AGI 的进步,但这并不意味着它在做什么方面是完美的,或者它接近于能够做人类能做的任何事情(这是 AGI 的通常定义之一),或者它有内在的动机和目标。”

研究人员指出,虽然 GPT-4“在许多任务上达到或超过了人类水平“,但它的整体 “智能模式明显不像人类“,其希望这一次的探索提供了一个欣赏 GPT-4的非凡能力和挑战的第一步,也希望 GPT-4为开发更正式和全面的方法来测试和分析具有如此广泛智能的未来人工智能系统开辟了新的机会。