高数有多难？AI高数考试正确率81%

高等数学相对于初等数学和中等数学，学的数学较难，是由微积分学，较深入的代数学、几何学以及它们之间的交叉内容所形成的一门基础学科。

高数一直是很多学生的噩梦，但是如果说你高数考得还不如AI好，是不是就更难以接受了？

来自OpenAI的Codex已经在MIT的7门高数课程题目中正确率达到81.1%，妥妥的MIT本科生水平。在此之前，科学家们一直尝试让AI机器人通过数学考试挑战，因为在此之前连年“失利”，从未及格，甚至低至20余分，使人们一度认为AI无法挑战高数。

据报道，谷歌的这个最新AI做题家，参加了四门考试。数学竞赛考试MATH，以往只有三届IMO金牌得主才拿过90分，普通的计算机博士甚至只能拿到40分左右。

至于别的AI做题家们，以前最好成绩只有6.9分……

但这一次，谷歌新AI却刷到了50分，比计算机博士还高。

综合考试MMLU-STEM，内含数理化生、电子工程和计算机科学，题目难度达到高中甚至大学水平。

这一次，谷歌AI“满血版”，也都拿到了做题家中的最高分，直接将分数拉高了20分左右。

小学数学题GSM8k，直接将成绩拉升到78分，相比之下GPT-3还没及格（仅55分）。

就连MIT本科和研究生学的固体化学、天文学、微分方程和狭义相对论等课程，谷歌新AI也能在200多道题中，答出将近三分之一。

最重要的是，与OpenAI凭借“编程技巧”取得数学高分的方法不同，谷歌AI这一次，走的可是“像人一样思考”的路子——

它像一个文科生一样只背书不做题，却掌握了更好的理工科解题技巧。

在业内人士看来，只靠语言模型，不对算数、逻辑和代数做硬编码达到这种水平，是这项研究最惊艳的地方。

总的来看，这次AI的表现让很多人感到惊艳，纷纷在评论区求API（可惜谷歌目前并没有公开计划）。

总之现在的情况，除了搞AI的在忙着读这篇论文以外。学生们盼着有一天能用AI做作业。

2022-08-12 08:00:57

海森大数据

行业新闻