简单文字变图像,你了解什么是生成式 AI 吗

在整个科技行业疲惫的2022年,生成式 AI(AIGC) 却在网络上越来越火,引发的讨论也越来越多,这种 AI 可以依据少量词汇在几秒钟内生成与之相匹配的图像。分析师预计,这种技术将被广泛用于各行各业,并产生数万亿美元的经济价值。


今年4月,一家名为Open AI的公司公布旗下的DALL-E 2模型,其用文字生成图像的质量之高,让人震惊——以前,“AI画画”还只是一小群人的游戏,AI画出来的画,像出自小学生之手一样朴实稚拙。然而AIGC进步神速。仅仅过了4个月,一名游戏设计师凭借AI模型Midjourney画出来的一幅画,夺取知名艺术大奖,这惹来争议一片。现在虽然这些计算机程序生成的图像并不完美,比如手上出现多余的手指,四肢不自然的弯曲等。同时,图像生成器在处理文本时也会遇到问题,例如生成无意义的符号等。但是这些图像生成程序可能是一场科技热潮的开始。

生成式AI能发展如此之快,原因首先在于,前几年全球科技行业斥巨资和大量人力,大练“AI大模型”,为之打下基础。


AI大模型,顾名思义,即是拥有巨大样本量的模型。2017年,Transformer结构的提出,让得深度学习模型参数突破了1亿。随着深度学习技术发展,模型中的数据量,更是逐步到了十亿级,再到百亿级。


红杉资本发表了一篇名为《生成式AI:一个充满创造力的新世界》(Generative AI: A Creative New World)的文章。红杉在文中表示,生成式AI,让机器开始大规模涉足知识类和创造性工作,这涉及数十亿人的工作,未来预计能够产生数万美元的经济价值。