迄今为止人工智能领域的一年:从 ChatGPT 到 Gemini 的最大故事以及接下来的发展

已发表: 2024-07-02

过去几年的生成式人工智能爆炸式增长在 2024 年并未放缓。出现了大量采用大型语言模型的新产品,并且几乎每天都会为现有服务推出一些新功能或工具。

ChatGPT 功能更加强大,并且拥有新的语音模式,Google Gemini 随处可见,从 Gmail 到 Google Drive,甚至 Apple 也终于进入了 AI(或 Apple Intelligence)领域。

然后还有从 Suno 到 Rabbit 等初创公司,他们正在寻找创新的方式来利用人工智能模型,无论是他们自己的还是市场主流公司构建的模型,今年剩余时间里还有更多值得期待的事情。

2024 年已经过去一半了,我们选择了一些今年最令人印象深刻、最引人注目、也可能最臭名昭著的 AI 版本,您今天就可以体验一下。 除此之外,我们还挑选了更多尚未推出但应该会在今年年底前推出的人工智能创新......

2024 年的人工智能:今年迄今为止最重要的发布是什么?

兔子R1评测

(图片来源:未来)

聊天GPT

ChatGPT 已经成为使用大型语言模型的生成式 AI 产品浪潮的默认术语。 然而,OpenAI 并没有依靠这一点来在竞争中保持领先地位,今年一直在定期增强人工智能聊天机器人及其链接服务。

2024 年,ChatGPT 获得了“记忆”功能,可以根据之前的交互调整其行为,以及“朗读”功能,可以将这些答案转化为 37 种语言和 5 种声音的音频表演。 定制也是一月份推出的 GPT 商店的核心,用户可以在其中构建和使用专注于特定任务的 ChatGPT 定制版本。

不太好的消息是,OpenAI 因“Sky”声音与电影《Her》中女演员的声音相似而与斯嘉丽·约翰逊发生了公开争执,此后不得不将其计划的语音模式升级推迟到“秋季”的某个时间。 ChatGPT 在 6 月份也经历了几次重大中断。

谷歌双子座

今年年初,Google Gemini 仅指 Google 打造的机型家族。 直到二月份,谷歌才抛弃了它所使用的 Bard 品牌,并将其所有的生成式人工智能项目纳入 Gemini 的保护之下。

其中一些新的和改进的功能似乎是为了赶上 ChatGPT,其中包括图像生成工具(在出现一些奇怪的幻觉问题后短暂下架)以及像 GPT 商店一样提供自定义聊天机器人的 Gems 商店。

否则,您可能会在最近几个月使用的所有其他 Google 产品中看到 Gemini - 帮助编写电子邮件、为照片添加注释以及充当 Android 手机上的助手。

兔子R1

Rabbit R1 在 1 月份的 CES 2024 上掀起了一场风暴,当时这款口袋大小、售价 200 美元的生成式 AI 设备首次亮相,该公司展示了它通过微型触摸屏、360 度摄像头和由 Perplexity AI 大型人工智能驱动的助手的功能,赢得了赞誉。实时答案的语言模型。 无需支付月费,它看起来更容易获得,而且销量也非常可观。

然而,Rabbit R1 的现实情况,包括电池续航时间不一致、有时表现迟缓、功能集仍然有限和其他缺陷,可能会成为未来硬件的一个警示故事,尽管它仍然很重要,并且可能值得购买合适的产品。用户。

人性化的AI Pin

与 Rabbit R1 一样,Humane AI Pin 是一款可穿戴设备,在 CES 2024 上引起了广泛关注。这款始终在线、生成式 AI 驱动的助手可以夹在你的衣服上,并承诺通过语音命令提供实时信息,并记录和记录你的信息。分析你一整天的互动和会议。

显而易见的是,鉴于其持续的收听功能,存在许多直接的隐私问题,更不用说在嘈杂环境中语音识别的可靠性问题了。 尽管存在这些缺点,它还是卖得很快,但据报道,Humane 目前正在寻找买家。

苏诺

今年最大的人工智能故事之一最终可能会成为像 Suno 和 Udio 这样的人工智能音乐生成器。 不仅因为两人都具有令人印象深刻的能力,可以通过简单的文本提示创作出一首还过得去的曲子——包括歌词、人声和乐器——而且因为美国唱片工业协会(RIAA)行业现在正在起诉两人侵犯版权。

这场诉讼可能会对人工智能音乐生成器和整个生成人工智能产生重大影响。 版权所有者和利用大量数据训练新人工智能工具的初创公司之间正在酝酿一场风暴,这场法律之战的走向将会令人着迷。 它可能会加速建立监管框架和配套法律来支持它,但在此之前,Suno 和 Udio 可以继续制作人工智能生成的音乐——就目前而言。

2024 年的人工智能:我们预计在今年剩余时间内会推出哪些产品?

Apple 的 Craig Federighi 在 2024 年全球开发者大会 (WWDC) 上展示 Apple Intelligence。

(图片来源:苹果)

苹果情报

Apple Intelligence 绝对是今年剩余时间内最受期待的人工智能功能。 苹果在 WWDC 2024 活动中透露,这一“个人智能”系统即将登陆 iOS 18、iPadOS 18 和 macOS Sequoia。 有时(在您的批准下)将 Apple 自己的模型与 ChatGPT 和其他人工智能平台相结合,Apple Intelligence 将增强 Siri 作为助手的能力,提供更好的指导和对上下文的理解。

它与屏幕感知相结合,让它执行与屏幕上的信息相关的操作,例如将消息中的地址添加到联系人卡片以及数百个其他操作。 同样的人工智能将帮助您编写电子邮件和消息、总结音频文件以及使用图像游乐场功能创建和编辑图像。 您甚至可以使用 Genmoji 功能制作原创表情符号。

要在 2024 年晚些时候在美国推出时使用它,您需要 M 系列 iPad 或 Mac,或者 iPhone 15 Pro 或 15 Pro Max 或更新版本,这意味着您可能需要升级。

亚马逊 Alexa

亚马逊在生成式人工智能的企业方面一直非常忙碌,但长期以来一直被视为语音人工智能助手的代名词的 Alexa 只进行了与 ChatGPT 等相关的人工智能升级。 今年这种情况可能会改变,但可能会花费你额外的费用。

有传言称,名为“Remarkable Alexa”的产品将于今年上市。 它可以结合生成人工智能功能,通过单个命令处理多项任务,甚至可以下食品配送订单。

展望

生成式人工智能在很大程度上仍然是一个发展空间,特别是当涉及到以消费者为中心的产品时。 明年可能会有一个更成熟的商业生态系统,但就目前而言,竞争的重点是大品牌的新功能,而其他公司则探索使用可用模型的新方法。 因此,这意味着软件订阅和有问题的硬件——至少目前是这样。