在2023中国计算机大会上,中文认知大模型企业北京智谱华章科技有限公司(下称“智谱AI”)推出第三代基座大模型ChatGLM3,采用多阶段增强预训练方法让训练更充分,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。
ChatGLM3语义能力与逻辑能力得到了大幅度增强,并实现了若干新功能的迭代升级,包括多模态大模型CogVLM的看图识语义功能,在10余个国际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。
目前ChatGLM3推出了可手机部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持vivo、小米、三星在内多款手机以及车载平台,支持移动平台上CPU芯片的推理,速度为20 tokens/s。
智谱AI是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。最新披露,公司2023年已累计获得超25亿人民币融资,投资方包括社保基金、阿里、腾讯、高瓴等知名机构。
目前,智谱AI估值已经超过100亿人民币。
2023-11-09 08:38:37
海森大数据