科技

GPT-40震撼空降为何百度文心一言遇冷

3月15日,Open AI正式对外发布了GPT的4.0版本,相比于之前已经神乎其神的3.5版本ChatGPT,GPT-4.0实现了进一步的飞跃。

从3.5到4.0,GPT取得重大突破

与3.5版本相比,GPT-4.0摆脱了“Chat”限制,在图片上拥有了视觉识别和逻辑推演能力。例如,给GPT-4.0一张气球的图片,它不仅能够识别气球形象,还能够回答出当绳子被剪断之后,气球能够飞起来,这就意味着GPT-4.0拥有了人类的眼睛,虽然还不能识别视频,但按照其进化的速度,或许下一个版本就能实现。

除了视觉识别之外,GPT-4.0最令人惊讶的是拥有了人类的思考能力与解题能力,并且成功通过了各类考试。例如,GPT-4.0参加美国的SAT考试,也就是美国的高考,获得了163分(满分180分),打败了88%的考生,同时在律师资格考试中也超过了90%的考生,并且能够做数学题以及大学物理题,这是上一代无法做到的。

如果说ChatGPT的发布让大家感觉只是一个有用的工具,偶尔也会出现“人工智障”,还能一笑而过,但4.0版本的发布却可怕得多,开始出现了替代人的能力,例如,律师之前是个高级行业,GPT通过了律师考试,那么未来法律咨询与出庭是否还需要律师?进一步延伸,有了图片的视觉识别能力,去医院拍个CT还需要去找医生吗?要知道,从3.5到4.0,只用了3个月,数据喂养的方式让GPT的能力实现了指数级的增长,那么从更多能力的实现、优化,到替代人工还需要多久呢?

GPT的前世今生

生成式AI,即人工智能生成内容(AI-Generated Content、AIGC),打破了传统AI应用模式。以 前,AI 更多是判别式AI,主要用于信息识别、垃圾邮件检测、人脸识别等,而目前的人工智能正在向生成式 AI 发展,主要以生成专业内容为主,像 CG建模师创作的阿凡达等电影,以及未来转换为在抖音等平台上生成一些内容。而ChatGPT的诞生,正式宣告了AI的应用模式已经从判别式转变成生成式:AIGC 代表着向强人工智能的迈进。

ChatGPT (Generated Pre-trained Transformers)的诞生最早可追溯到2013 年,谷歌提出了一个最初始的原则,基于深度学习的神经语言模型,即用神经网络的方法去研究自然语言处理(NLP)。

2017 年,谷歌发布了第一版的 Transformer 算法模型,成为了大型语言模型(LLMs)发展的转折点。Transformers是一种深度学习模型,使自我监督学习成为可能,并使人工智能的速度达到了极限,用于NLP时,还可以更有效地训练AI GPU,与其他模型相比,显著降低了训练成本。

随后,OpenAl 在谷歌提出 Transformer 模型之后成立,从 2018 到 2020 年分别发布了GPT-1、GPT-2、GPT-3。2022年11月30 日,OpenAl 发布新版GPT3.5,在原有基础上加入了一些人工干预的部分。自推出以来,它成为了历史上增长最快的消费级应用程序,在2023年1月累计了1亿的月平均用户(MAU)。相比之下,之前增长最快的应用程序是TikTok(9个月)和Instagram(2.5年)。

而ChatGPT只是GPT其中一个应用领域,从产业应用方向来看,会有几个层级: 第一个层级,就是基于应用,例如微软把 GPT 模型嵌入到产品链里面去;第二个层级,是优化或者构建 GPT 专用模型,例如百度的文心系列,文心一格是绘画模型,文心一言是专门做语言预测模型的。虽然针对行业专业数据百度应用做得不错,但是针对最底层意图的理解以及最底层的部分,还需要有很多数据来源和模型训练。

OpenAI 更多的是把工具应用到实际产业来推出产品,所以对百度等国内公司而言,工具的部分已有布局,现在需要推出对应的产品。AIGC 的应用场景里面,文字、图像、视频音频等是AI 领域发展较多的,另外在嵌入式的结合部分,在NLF的处理方面,微软中国与小冰公司达成战略合作,但是还在发展中。最底层算力的部分,国内有自己对应 AI 算力芯片和架构的公司,像是地平线就是嵌入到了自动驾驶、终端智能。

GPT-4.0已经有了取代专业技能职业能力的迹象,随着未来的数据喂养以及版本迭代,进展很可能会超乎意料。与当年机器替代人工主要影响的是体力劳动工人相比,GPT的颠覆是方方面面的,脑力劳动的白领首当其冲,或许只有那些依托情感的服务类工作暂时还不能被GPT取代,例如:幼儿园阿姨、养老院护工等。