GPT-5 预览:迄今为止我们所知道的关于新 OpenAI 模型的一切

已发表: 2024-03-20

虽然我们大多数人仍然对ChatGPT及其不断发展的功能感到敬畏,但 OpenAI 首席执行官 Sam Altman 最近似乎对其公司当前的产品不太感兴趣。

更具体地说,他表示 ChatGPT 的大脑,即被称为 GPT-4 的大型语言模型 (LLM),仍然“有点糟糕”。 他将 GPT 的发展描述为一条“指数曲线”,目前提供了“令人惊叹的曙光”,但很快就会被 GPT-5 的功能所掩盖。

说这在互联网上引起了轰动有点言过其实,但它确实引起了很多人的讨论,而且大部分讨论都围绕着对 GPT-5 的期望。 以下是迄今为止我们所知道的所有内容,包括所有最新的 GPT-5 新闻和我们自己的一些预测。

GPT-5是什么?

GPT 是人工智能术语“生成式预训练变压器”的简写。 它是一个大型语言模型(LLM),由人工智能巨头 OpenAI 开发,作为公司聊天机器人 ChatGPT 的框架,ChatGPT 是最好的人工智能聊天机器人之一。

另一种思考方式是,GPT 模型是 ChatGPT 的大脑,或者如果您愿意的话,也可以是它的引擎。 GPT-5 将是 OpenAI 此类模型的第五个完整版本。

冲浪鲨标志 想要私密地浏览网页吗? 或者看起来好像您在另一个国家?
通过此 tech.co 特别优惠,享受 Surfshark 86% 的巨额折扣。 查看交易按钮

第一个是 2018 年一篇研究论文中披露的概念验证,最近的一个是 GPT-4,于 2023 年进入公众视野。

目前,GPT-5 看起来仍然距离发布还有很长的路要走,尽管新模型的开发已经得到确认,并且据了解其训练正在进行中。

这需要多长时间是一个无法回答的问题,因为 OpenAI 可能需要花很长时间来完善其基本功能,或者尝试尽快推出新版本,以在人工智能军备竞赛中保持领先地位。

GPT-5 预览:最新消息和期待

当谈到 GPT-5 的发布传闻时,目前的情况主要是猜测,尽管我们现在也知道一些确凿的事实。

以下是我们认为我们可能会从 GPT-5 中看到的内容,并得出其实际发布时间的结论。

GPT-4.5 泄露暗示 2024 年 6 月发布窗口

正如 GPT-3.5 的增量发布(为 ChatGPT-4 本身铺平了道路)所证明的那样,OpenAI 看起来正在采用增量更新策略,GPT-4.5 将在 GPT-5 之前发布。

这意味着在我们了解 GPT-5 中可能看到的内容之前,我们需要停下来考虑一下 GPT-4.5。

事实上,如果互联网技术侦探可信的话,OpenAI 声称的 GPT-4.5 发布窗口可能已经被泄露。 显然,微软的 Bing 和 DuckDuckGo 搜索引擎都索引了一篇 OpenAI 博客文章,该文章引用了 GPT-4.5 模型的可用性,并指定了 2024 年 6 月的“知识截止日期”。

因此,GPT-4.5 本身可能会在 24 年夏天左右发布,因为 OpenAI 试图跟上Anthropic 的 Claude 3等新发布的竞争对手,并最终为 GPT-5 在 2024 年末或 2025 年某个时候发布铺平道路。

更让 GPT-4.5 即将发布的谣言更加可信的是,您现在可以在 Copilot 中免费使用 GPT-4 Turbo ,而之前 Copilot 只是免费获取 GPT-4 的最佳方式之一。

再加上2024 年 3 月的 Microsoft Surface 活动,考虑到微软是 OpenAI 最大的合作伙伴、投资者之一,甚至是该公司的董事会成员,你甚至可以初步了解 GPT-4.5 的走秀。

GPT-5确认正在开发中

除了 OpenAI 发布 GPT-4.5 的可能性即将到来之外,我们现在还确认该公司确实正在开发 GPT-5,因此其下一代 LLM 实际上正在开发中,而不仅仅是一个互联网白日梦。

OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman) 在 2024 年初在科技偶像比尔·盖茨 (Bill Gates) 的 Unconfuse Me 播客上透露了同样的信息。

预计 GPT-5 参数相对于 GPT-4 会有重大飞跃

现在,随着我们接近更多的推测领域和 GPT-5 谣言,我们或多或少确定的另一件事是,与 GPT-4 相比,GPT-5 将提供显着增强的机器学习规范。

头条新闻可能是它的参数,预计将出现巨大飞跃,因为 GPT-5 的能力远远超过以前模型的能力。 我们并不确切知道这会是什么,但从一个想法来看,从 GPT-3 的 1750 亿个参数到 GPT-4 报道的 1.5 万亿个参数的跳跃是 8-9 倍的增长。

OpenAI 是否能与之匹敌还有待观察,但基于从 GPT-2 到 GPT-3 115 倍的跳跃几乎肯定永远不会重复这一事实,可能会出现收益递减法则。

如果 OpenAI 能够通过 GPT-5 实现 4-5 倍的参数增加,那将是一个现象级的成就,特别是当你考虑到最新的行业基准 Anthropic 的 Claude 3 Opus 是一个 2 万亿参数模型,因此即使将参数增加一倍, GPT-4 将是一项令人印象深刻的壮举。

因为我们这里谈论的是数万亿美元,所以任何增长的影响都将是引人注目的。 预计 GPT-5 拥有更大的上下文窗口和更新的知识截止日期也是安全的,它甚至可能能够实时处理某些信息(例如社交媒体源)。

Sora 和 GPT-5 前沿的多模态

尽管人们对即将推出的 GPT-4.5 感到兴奋,但人们对 OpenAI 最近发布的文本到视频生成器(名为Sora)更加感兴趣。

Sora 是 OpenAI 目前寻求在其产品中构建真正的多模态的最新举措,ChatGPT Plus(聊天机器人的付费层,每月花费 20 美元)提供与 OpenAI 的 DALL-E AI 图像生成器的集成。 它让您只需在 ChatGPT 中输入文本提示即可制作“原始”AI 图像。

使用 Sora,您将能够执行相同的操作,只是您将获得视频输出。 索拉的力量的早期展示让互联网陷入了疯狂,即使在目睹科技“下一件大事”来来去去十多年之后,我不得不说它令人印象深刻。

在 GPT-5 发布之前,Sora 很有可能进入公开测试版或 ChatGPT Plus,但即使是这样,当 OpenAI 的下一代 LLM 最终落地时,它也将比以往任何时候都更大、更好。

Sora 视频截图显示一名女子夜间穿过东京

GPT-5 可能迎来 AGI 的 Project Q* 时代

当然,在任何关于 GPT-5 的讨论中都不能忽视这样一个事实:在幕后,OpenAI 不仅致力于开发其当前的 AI 产品套件,而且还致力于推出新一代通用人工智能 (AGI)。 )目前被称为Project Q* 的技术。

AGI 是当人工智能变得“超级智能”时给出的术语,或者说具有人类认知水平的学习、推理和决策能力。 这基本上意味着 AGI 系统能够完全独立于习得的信息而运行,从而离成为有感知力的存在又近了一步。

当当前的人工智能技术似乎无法阻止自己产生幻觉信息或为笑话生成奇怪的种族主义图像时,至少可以说这是一个极具争议的前景,并且出于道德原因受到行业内许多人的反对。

尽管如此,OpenAI 是其主要支持者之一,随着下一个主要 GPT 版本 GPT-5,我们有机会了解更多有关 Project Q* AGI 超级智能的最终目标,如果没有看到成品,按照 Altman 的说法自己的陈述。

GPT-6也被OpenAI“确认”

当我们完全可以超越自己时,为什么还要超越自己呢? 在另一份声明中,这次可以追溯到去年 9 月的 Y Combinator 活动,OpenAI 首席执行官 Sam Altman 不仅提到了 GPT-5 的开发,还提到了其继任者 GPT-6 的开发。

他表示,距离发布还有很长的路要走。 两者的目标都是以更低的成本获得更高的可靠性; 正如我们上面所暗示的,两者都没有被归类为 AGI 产品。

GPT-5 潜在发布预测

根据我们过去听到和看到的情况,我们大胆猜测GPT-5 可能会在 2024 年 11 月旧金山的下一个 OpenAI DevDay 上发布

那时我们第一次接触到 GPT-4 Turbo——GPT-4 的最新、最强大的版本——如果 GPT-4.5 确实在今年夏天发布,那么 DevDay 2024 可能会让我们第一次看到 GPT-5。

也就是说,GPT-4.5 Turbo 可能会在 2024 年 DevDay 上进入公众视野,为2025 年推出 GPT-5铺平道路,这与 OpenAI 首席执行官 Sam Altman 最近的评论相吻合。

在 2024 年 3 月接受 Lex Freidman 播客采访时,Altman 表示“诚实的答案”是他不知道 GPT-5 何时准备就绪,并表示他的公司在下一个版本之前还有“许多其他重要的事情要发布”主要法学硕士更新。

“很多”大概是指 Sora 和 GPT-4.5,但我们必须拭目以待。

另外,今年 3 月的《商业内幕》报道称,匿名消息人士向该出版物透露 GPT-5 将于 2024 年中期发布,因此现阶段每个人都在猜测。

GPT 模型发布历史和时间表

要了解 GPT-5 何时发布,查看过去的 GPT 模型的发布时间会很有帮助。 以下概述了 OpenAI 的 GPT 模型历史。

GPT-1

最初的 GPT 于2018 年 6 月发布,但仅作为概念证明,构成 OpenAI 研究论文“通过生成预训练提高语言理解”的关键部分。

1.17 亿个参数的模型并未向公众发布,而且 OpenAI 还需要好几年才能拥有一个他们乐于将其纳入面向消费者的产品中的模型。

GPT-2

第二个基础 GPT 版本于2019 年 2 月首次发布,并于当年 11 月全面发布。 它能够进行基本的文本生成、摘要、翻译和推理,被誉为该领域的突破。

这个15 亿参数模型在 800 万个网页的数据集上进行了预训练,成为第一个公开可用的 GPT 版本,尽管它的使用主要是实验性的,并且仅限于机器学习社区。

通用技术3

GPT-3 代表了 OpenAI 向前迈出的又一大步,于2020 年 6 月发布。 1750 亿参数模型现在能够生成许多评论家发现与人类编写的文本无法区分的文本。

虽然距离 ChatGPT 的发布还有几年的时间,但 OpenAI 的最新成果已经引起了科技界的所有人的议论,而《卫报》甚至发表了一篇由 GPT-3 撰写的整篇文章,以展示其迄今为止不可思议的能力。

GPT-3.5

GPT-3.5 于2022 年 3 月发布,是 ChatGPT 构建的基石。 它基于与 GPT-3 相同的1750 亿个参数转换器,但根据截至 2021 年 6 月的数据进行了微调和训练。

GPT-3.5 发布后,ChatGPT 于 2022 年 11 月发布。 其余的,正如他们所说,是历史。

GPT-4

任何使用过 ChatGPT 早期版本的人都会告诉您,这个世界上现在最受欢迎的人工智能聊天机器人虽然令人印象深刻,但也存在明显的缺陷。 OpenAI 于2023 年 3 月推出的 GPT-4 是解决这个问题的尝试。

Altman 自己承认,这仍然是一项正在进行中的工作,但 GPT-4 已经是人工智能技术向前迈出的令人兴奋的一步,该技术现在已经足够好,不仅可以被懒惰的大学生广泛使用,而且可以被各大企业广泛使用,作为他们的一部分。日常运营。

虽然 OpenAI 尚未确认 GPT-4 参数的实际数量,但一般认为在1.5 万亿个左右。