【来源:虎嗅网】
猝不及防地,GPT-4就这样退出历史舞台了。
4月10日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。
从4月30日起,GPT-4将被当前的默认模型GPT-4o完全取代。
不过,怀念GPT-4的用户们也不必悲伤,它仍然可以通过OpenAI API继续使用。
不过,在GPT-4退役之前,人们的注意力很可能就会转向ChatGPT的新模型。
如今各种爆料已经传得漫天飞,据说,GPT-4.1(包括GPT-4.1-mini、GPT-4.1-nano和GPT-4.1),去年12月宣布的o3 “推理”模型,以及o4-mini全新推理模型都要来了。
遥想2023年3月14日,GPT-4正式发布,席卷全球,在全球掀起滔天巨浪,然后在两年内,引爆了全球AI大模型的寒武纪大爆发。
它的出现,开启了一个全新的时代,见证了一场技术井喷的大爆发,铺垫了后续无数OpenAI大模型的繁荣。
如今,这座灯塔终于要退出了。
GPT-4,已成历史尘埃
Perplexity CEO Aravind Srinivas最近表示,AI的进步已经跨越了临界点——三个月的时间,仿佛就已经跳过了一章历史。
“我们应该期待,在今年剩余的时间里,变化会来得更快。”
的确,就在过去短短三个月里,我们迎来了DeepSeek R1、原生图像生成、o3-mini等重磅炸弹,如今2025年也不过刚过去了四个月。
在AI圈的众多消息中,连GPT-4的退出都显得不那么惊爆了。
昨天的更新日志中,OpenAI表示,现在GPT-4o已经成为了GPT-4合格的继任者。
近期的升级,提升了它的指令跟随、问题解决和对话流畅性。评估中,GPT-4o在写作、编码、STEM等方面始终优于GPT-4。
确实,现在很多人都已经不记得,自己上一次用GPT-4是什么时候了。
虽然它确实给很多人带来了美好的回忆,甚至让人一度以为AGI已经来了。
还记得2023年3月,GPT-4推出时全网欢呼的盛况吗?
当时,它在ChatGPT和微软的Copilot网页版聊天机器人中上线,引起全网惊呼。
这个模型具备多模态能力,能同时理解图像和文本,正式开启了AI“看图说话”的时代,这在OpenAI的模型中尚属首次,可谓石破天惊。
相比于GPT-3.5,GPT-4是一次更重大的认知跃迁。
它是首个在专业学术基准中达到哈佛、斯坦福毕业生水平的大模型。
它在数学、医学、法律之类的考试中击败大多数人类;在SAT、LSAT、美国律师资格考试中交出惊人答卷,能达到TOP 10%。
它的多模态架构,也为后续的模型演进提供了核心蓝本。
从此,大模型能力的阈值彻底提升至可用级,引爆了全球的AI应用生态,将生成式AI市场从百亿规模推升至万亿的量级。
它推动了Code Interpreter的诞生,为开发者提供了无限助力,间接推动了开源生态。
那时,几乎每天一个劲爆消息。那是OpenAI的高光时刻,它的一举一动都牵动着全世界的目光。
当时,全网都在猜测GPT-4的训练成本。后来奥特曼透露,GPT-4的训练成本超过了1亿美元。
终于,在2023年11月,速度更快、成本更低的GPT-4 Turbo上线,接替了它的地位。
GPT-4,经典高光时刻
还记得这些辉煌时刻吗?
2024年3月14日,GPT-4诞生,首个多模态大模型震惊全世界,在GRE等各类考试中取得满分,凭自己就能考上斯坦福。
2024年3月16日,GPT-4全面接入微软Office全家桶,颠覆10亿打工人,人类与电脑交互方式彻底改变。
2024年3月17日,OpenAI发布35页论文官宣:GPT时代,80%的美国人就业将受AI影响。
2024年3月22日,微软154页研究刷屏,GPT-4已经可以被视为一个通用人工智能的早期版本。
2024年5月4日,GPT-4正式联网,微软开放搭载GPT-4的全新Bing聊天机器人,全面开放插件系统,无需排队人人可用。
2024年7月7日,Code Interpreter官宣向Plus用户全面开放,实测案例惊人。
下一个模型是GPT-4.1
就在前一天,The Verge独家爆料称,OpenAI正准备发布一系列全新模型——包括GPT-4.1(含GPT-4.1 mini和GPT-4.1 nano)、满血版o3,以及神秘的o4系列(o4-mini、o4-mini-high)。
其中,作为多模态模型GPT-4o改进版的GPT-4.1,最快将在下周面世。
目前,AI工程师Tibor Blaho已经在ChatGPT网页代码中发现了对这些模型的引用。
不过,GPT-4.5都来了,为什么下一个却是GPT-4.1?这个越来越倒退的命名规则,实在令人摸不到头脑。
它在OpenAI大模型谱系上,实在有点前不着村后不着店,不知该放在什么位置。
有人赞叹道:看到从GPT-1到o系列以及更高级别的演变,展示了不断增加的复杂性和能力。这就像观察人工智能的进化史!
关于GPT-4.1,现在坊间已经有了蛛丝马迹。
比如有人发现,在ChatGPT的模型列表中,竟然已经出现了GPT-4.1这个选项。
这就意味着,此前泄露的小道消息是真的!这就让大家非常兴奋。
但也有人怀疑该网友是造假,把网址从GPT-4o改为了GPT-4.1。
为了证实清白,这名网友大方分享出了自己和GPT-4.1的对话链接。
因此大家确认,这名网友并没有撒谎,或伪造截图,因为顺着这个对话链接检查,会发现model-slug确实是GPT-4.1。
很快,有越来越多的人发现自己也能用GPT-4.1了。
此外,也有网友推测,奥特曼口中的“Quasars Alpha”,就是GPT-4.1。
为保o3发布,测试时间大幅缩短
而FT的报道也再次证实,满血版o3下周很可能再次上线。
知情人士透露,由于Meta、谷歌、xAI这些对手逼得实在太紧,OpenAI为了保持自己的技术优势并从中获利,不得不加快模型的发布速度。
为此,曾经需要数月时间进行的模型“评估”——测试模型的风险和性能,如今已被压缩到了只有短短的几天。
比如即将退役的GPT-4,就有着长达6个月的评估期。其中一些危险能力,正是在测试进行了两个月后才被发现的。
但现在给到的时间和资源,已经不足以进行全面的测试来识别和规避风险了。
此前,OpenAI曾承诺构建定制版的模型来评估潜在的滥用风险,例如是否可能助长生物病毒提高传播能力。
但这种方法成本很高,不仅要聘请外部专家,还要创建诸如病毒学这类的专业信息数据集,并将其“喂”给模型来进行微调,消耗大量的工程师和计算资源。
很明显,OpenAI不想在这件事上花太多精力——他们只对能力较弱的旧模型做了微调,没有用到更强、更先进的模型上。
比如,在1月份发布的o3-mini安全与性能报告中,只提到了GPT-4o只会在微调后才能执行某项生物学任务。至于o1和o3-mini如何,OpenAI却只字未提。
另外,还有一个令人担忧的问题是,安全测试针对的并不是最终向公众发布的模型,而是更为早期的“检查点”(checkpoints)。在这之后,模型还会继续更新来提升性能和能力。
面对这些质疑,OpenAI回应称,其评估流程已通过引入自动化测试等方式提高了效率,从而缩短了所需时间。
“虽然目前还没有一套公认的方案,但OpenAI采用的方法肯定是最优的,并且已在报告中公开透明地进行了说明。”
此外,OpenAI还表示,测试所用的检查点与最终发布的版本“基本一致”。
参考资料:
https://x.com/whylifeis4/status/1910719046665884006
https://www.ft.com/content/8253b66e-ade7-4d1f-993b-2d0779c7e7d8
https://techcrunch.com/2025/04/11/openai-is-winding-down-its-gpt-4-ai-model-in-chatgpt/
本文来自微信公众号:新智元,作者:新智元