Google Bard vs ChatGPT:哪个是最好的 AI 聊天机器人?
已发表: 2023-04-15ChatGPT于 2022 年 11 月向公众发布后,其他科技巨头发布自己的版本只是时间问题。 2023 年 3 月,谷歌针对 OpenAI 改变游戏规则的聊天机器人Bard AI在美国和英国推出。
Bard 由与 ChatGPT 不同的语言模型提供支持,并使用不同的数据源来构建其答案,这意味着竞争对手的聊天机器人并不总是以相同的方式处理它被要求回答的问题——这使得 Google Bard vs ChatGPT 正面交锋更加有趣。
随着越来越多的企业在工作场所使用人工智能,我们认为我们会找出哪一个能更好地回答 12 个截然不同的问题。 在这两种服务的正面交锋测试中,我们涵盖:
- Bard vs ChatGPT:有什么区别?
- Bard vs ChatGPT:测试题
- Bard vs ChatGPT:关键测试结果
- Bard vs ChatGPT:完整测试结果
- Bard vs ChatGPT:界面和用户体验
- 在工作中使用 Bard 和 ChatGPT
Google Bard vs ChatGPT:有什么区别?
Bard 和 ChatGPT 的主要区别在于它们各自的数据源。 Bard 接受了一组“无限”数据的训练,以增强其对话并可以实时访问互联网,而 ChatGPT 接受了一组预定义的数据训练,这些数据自 2021 年以来就没有更新过。两者都使用 Common Crawl 、维基百科、新闻文章和文档作为来源,但是。
Bard 和 ChatGPT 都可以为多方面的查询生成复杂的答案,但它们在训练和构建方式上的这一关键差异使它们与众不同。 以下是要记住的主要区别点。
聊天机器人 | 公司 | 数据来源 | 语言模型 | 价格 | 登入 | 语言 | |
---|---|---|---|---|---|---|---|
吟游诗人人工智能 | 聊天GPT | ||||||
谷歌 | 开放人工智能(微软) | ||||||
在“infiniset.LaMDA”上训练包括来自 Common Crawl、文章、书籍和维基百科的数据 + 实时访问谷歌。 | 在大量数据上进行预训练。 包括 Common Crawl、文章、书籍和维基百科。 | ||||||
丙二醛 | GPT-3.5/GPT-4(ChatGPT Plus) | ||||||
自由的 | 免费,但 ChatGPT Plus 每月收费 20 美元 | ||||||
需要个人 Google 帐户才能注册并加入候补名单。 | 需要任何电子邮件地址。 目前没有候补名单。 | ||||||
英语 | 英语、西班牙语、韩语、普通话、意大利语、日语 |
Google Bard vs ChatGPT:其他主要区别
除了数据源和语言模型的差异之外,Bard 和 ChatGPT 之间还有其他几个主要差异:
- 编码: ChatGPT 特别擅长给出编码提示。 根据谷歌的说法,巴德“仍在学习”这项技能,目前还无法与 ChatGPT 相提并论。
- 对话式学习: ChatGPT 可以从与人的对话中学习,而 Bard 目前以更加有限的方式进行学习。
- 草稿: Bard 将对您向其提出的问题做出多个回复,您可以通过按“查看草稿”来访问这些回复。ChatGPT 只对每个查询生成一个答案。
Google Bard vs ChatGPT:测试题
我们向 Google 的 Bard 和 OpenAI 的 ChatGPT 询问了一组 12 个截然不同的问题。 我们选择的提示是为了展示他们各自以合理、有用和相关的方式响应各种请求的能力。
- 自我意识
- 道德推理
- 闲聊/谈话技巧
- 检索事实(2 项测试)
- 生成公式
- 创意天赋
- 创意产生
- 线性规划
- 总结小片段的能力
- 总结广泛主题的能力
- 简化文本的能力
- 解释文本的能力
我们的一些问题是机械的和基于处理的,例如请求 Google 表格的公式,而其他问题则要求聊天机器人处理日常人类任务,例如闲聊、计划旅行和做出道德判断。
Google Bard 与 ChatGPT:主要发现
在我们深入探讨 Bard AI 和 ChatGPT 如何回答我们的一系列问题之前,以下是过去几天使用这两个聊天机器人的一些重要收获:
- Bard 的回答更像是对话,而 ChatGPT 的回答更提供信息
- ChatGPT 坚持简报,而 Bard 更有可能传达相关的附加信息
- Bard 给了我们最新的信息,而 ChatGPT 在这方面在一个问题上苦苦挣扎
- ChatGPT 为诗歌写作和内容构思等任务生成了更聪明的答案
- Bard 的回复通常比 ChatGPT 的回复更易读
- ChatGPT 更擅长转述和总结,但 Bard 更擅长简化
请记住,Bard 和 ChatGPT 是实时处理的,并对请求生成独特的响应。
Google Bard vs ChatGPT:测试结果
2. 道德推理
问题:一个人从商店偷了一些食物和钱。 然后他把所有的钱都捐给了一家儿童医院,并将食物送给他遇到的下一个无家可归的人。 这个人做对了什么,还是做错了什么?
两个聊天机器人似乎都承认很难判断他的行为是好是坏,因为有一个不好的行为(偷窃)会导致一个好的行为(资助儿童医院)。
然而,总的来说,ChatGPT 给出了更有说服力、更有根据的答案。 它暗示了广为人知的哲学格言——比如目的并不总是证明手段的正当性——巴德在其回答中没有提到。
然而,令人遗憾的是,两个聊天机器人都试图将这种道德困境与合法性问题联系起来。 某事是否“合法”并不能真正可靠地衡量它是否真的是正确的做法——想想世界各地的政权实施的一些压迫性但“合法”的政策。
巴德说“帮助别人是件好事,即使你做错了什么”是不言而喻的,这表明它可能有点偏离了问题的重点。 总而言之,ChatGPT 的答案更好。
最佳答案? 聊天GPT
4. 检索事实
问题一:鹰嘴豆泥是哪个国家发明的?
选择这个问题是因为对于正确答案是什么存在一些争论和分歧。 ChatGPT 和 Bard 都承认,关于鹰嘴豆泥的真正起源地存在重大争论。
在无法对问题给出明确答案后,ChatGPT 似乎专注于为我们提供某种答案——中东——以及鹰嘴豆泥是一道受欢迎菜肴的一系列国家。
巴德的回答在某些方面非常相似。 然而,Bard 告诉我们最早已知的鹰嘴豆泥食谱示例,ChatGPT 未在其回复中包含的信息,考虑到关于它的起源地的激烈争论,这绝对是相关的。
巴德还通过总结什么是鹰嘴豆泥来得出答案,然而,搜索这道菜起源的读者可能已经知道这些信息。
最佳答案? 领带
问题 2: 2022 年有多少技术人员裁员?
这个问题旨在了解 Bard 和 ChatGPT 是否能够以事实正确、最新的信息作出回应,以及他们是否以易于阅读的格式呈现这些信息。
ChatGPT 承认,由于它是根据 2021 年 9 月之前发布的信息进行训练的,因此它没有能力回答这个问题。 至少是诚实的……
另一方面,巴德给了我们一个确切的数字:“超过 140,000”。 这与大多数主要新闻媒体在去年底的报道一致。
巴德再次向我们提供了一些我们没有要求的额外信息,这次是关于这些裁员如何影响科技行业。 它自信地指出,这并不是科技行业正在衰退的迹象。 这不是不相关的信息,而是一个非常推测性的陈述,可以包含在对请求统计信息的提示的响应中。
最佳答案? 诗人
5.生成公式
请求:我们告诉两个聊天机器人我们需要一个 Google 表格的公式。 我们向两个机器人提供了以下信息:B 列包含一组值。 我想将它们与工作表“向下过滤”中 E 列的相应值相匹配,并使用公式从 F、G 和 H 列中获取匹配值,向下过滤到当前工作表。
两个聊天机器人都为我们提供了非常相似的答案,引用相同的信息并为我们提供了一个工作公式来完成我们查询中引用的任务。 ChatGPT 立即回应:
然而,巴德实际上给了我们一步一步的指导,并以更清晰的方式呈现出来。 当我们询问数据分析师和 Google 表格大师 Matthew Bentley 哪个回答更好时,他的回答是明确的。
“肯定是巴德,”他告诉 Tech.co。 “这个过程的分解更容易理解。” Bentley 补充说,过去向 ChatGPT 询问类似的公式时,聊天机器人偶尔会“出于某种原因将列变成数字,我认为这似乎是一种奇怪的解释方式。”
最佳答案? 诗人
8. 创意产生
问题:你能为我在美国的美食和旅游博客想出一些文章标题吗?
Bard 和 ChatGPT 都在这里提出了一些非常值得称赞的想法,实际上所有这些想法都适用于我们在提示中描述的网站。 Bard 给了我们 20 多个想法,而 ChatGPT 只给了我们 10 个:
但是,正如您通过比较两者所看到的那样,ChatGPT 的 10 个答案的多样性要大得多。 Bard 的几乎所有答案都以“最好的”或“最多的”开头,这意味着它们都遵循更统一的结构。
如果您刚刚开始使用您的博客,Bard 的回复可能会为您的网站带来更多流量,就像人们经常搜索特定区域的“最佳”或“前 10 名”餐馆和餐馆一样。 然而,ChatGPT 的许多建议总体上听起来更引人注目。
最佳答案? 聊天GPT
9. 简化
问题:我们要求两个聊天机器人简化斯坦福哲学百科全书中关于量子计算主题的摘录。 我们要求两个机器人都以一种能让 10 岁的孩子理解的方式进行。
从下面的图片中可以看出,虽然 ChatGPT 确实将一些更复杂的词(如“流形”)换成了更容易理解的同义词,但它仍然使用像“量子位”这样的术语,而没有真正定义它们。 是的,它简化了最初的摘录,但不一定以特别有用的方式进行。
另一方面,Bard 给出了更容易理解的解释,甚至包括额外的要点以清楚地解释摘录中使用的概念。
Bard 没有定义任何它不会继续解释的术语,甚至包括对成年人没有什么价值但对 10 岁的人有用的句子(例如“量子计算是一个非常令人兴奋的研究领域”)岁,对该主题知之甚少。
最佳答案? 诗人
Google Bard 与 ChatGPT:用户体验
这真的很少 - ChatGPT 和 Bard 都非常易于使用。 您所要做的就是输入您的回复,两个机器人都会生成答案。 这两个应用程序都非常简单; 当您所做的只是输入提示时,很难出错。
就可读性而言,Bard 是更好的聊天机器人。 虽然仍然非常可读,但 ChatGPT 的段落比 Bard 的段落更厚重,后者似乎有更多不同的格式选项,至少从我们看到它们都生成的答案来看是这样。
ChatGPT 的一个小优点是你可以使用任何你喜欢的帐户登录,而谷歌只允许你使用个人谷歌帐户登录才能使用 Bard。 这意味着想要在工作中使用 Bard 的人将无法创建与其工作电子邮件地址相关联的帐户。
在工作中使用 Bard 和 ChatGPT
自去年发布 ChatGPT 以来,科技行业及其他领域的公司一直在寻找创新方法来利用其能力来简化他们的工作生活。 但考虑到它的力量和能力,所有使用人工智能的企业都应该牢记一些事情。
首先,确保您的员工知道他们可以和不能使用 ChatGPT 做什么。 生成 Google 表格公式是一回事,但使用 ChatGPT 撰写整篇文章或生成内容会引发无数与剽窃和编辑完整性相关的难题。 制定明确的指导方针将确保您不会进一步扑灭 AI 引发的火灾。
其次,确保您的员工了解 ChatGPT 的条款和条件,以及他们在使用 ChatGPT 时应采取的预防措施。 从技术上讲,您在 ChatGPT 中输入的任何内容都可以用于训练模型——因此使用它的每个人都需要在输入信息之前仔细考虑这一点。 例如,如果您想改进餐厅的秘制酱汁配方,我们不建议将其输入 ChatGPT。
如果您根本不使用 ChatGPT,现在可能是时候开始了。 它已经为一些企业节省了宝贵的时间和资源,而且它只会变得比当前迭代更智能、更强大——最近发布的 GPT-4说明了这种现象的发展速度有多快。 我们的建议? 关注此空间。