高等数学相对于初等数学和中等数学,学的数学较难,是由微积分学,较深入的代数学、几何学以及它们之间的交叉内容所形成的一门基础学科。
高数一直是很多学生的噩梦,但是如果说你高数考得还不如AI好,是不是就更难以接受了?
来自OpenAI的Codex已经在MIT的7门高数课程题目中正确率达到81.1%,妥妥的MIT本科生水平。在此之前,科学家们一直尝试让AI机器人通过数学考试挑战,因为在此之前连年“失利”,从未及格,甚至低至20余分,使人们一度认为AI无法挑战高数。
据报道,谷歌的这个最新AI做题家,参加了四门考试。数学竞赛考试MATH,以往只有三届IMO金牌得主才拿过90分,普通的计算机博士甚至只能拿到40分左右。
至于别的AI做题家们,以前最好成绩只有6.9分……
但这一次,谷歌新AI却刷到了50分,比计算机博士还高。
综合考试MMLU-STEM,内含数理化生、电子工程和计算机科学,题目难度达到高中甚至大学水平。
这一次,谷歌AI“满血版”,也都拿到了做题家中的最高分,直接将分数拉高了20分左右。
小学数学题GSM8k,直接将成绩拉升到78分,相比之下GPT-3还没及格(仅55分)。
就连MIT本科和研究生学的固体化学、天文学、微分方程和狭义相对论等课程,谷歌新AI也能在200多道题中,答出将近三分之一。
最重要的是,与OpenAI凭借“编程技巧”取得数学高分的方法不同,谷歌AI这一次,走的可是“像人一样思考”的路子——
它像一个文科生一样只背书不做题,却掌握了更好的理工科解题技巧。
在业内人士看来,只靠语言模型,不对算数、逻辑和代数做硬编码达到这种水平,是这项研究最惊艳的地方。
总的来看,这次AI的表现让很多人感到惊艳,纷纷在评论区求API(可惜谷歌目前并没有公开计划)。
总之现在的情况,除了搞AI的在忙着读这篇论文以外。学生们盼着有一天能用AI做作业。
2022-08-12 08:00:57
海森大数据