Google Bard vs ChatGPT:哪个是最好的 AI 聊天机器人?

已发表: 2023-04-15

ChatGPT于 2022 年 11 月向公众发布后,其他科技巨头发布自己的版本只是时间问题。 2023 年 3 月,谷歌针对 OpenAI 改变游戏规则的聊天机器人Bard AI在美国和英国推出。

Bard 由与 ChatGPT 不同的语言模型提供支持,并使用不同的数据源来构建其答案,这意味着竞争对手的聊天机器人并不总是以相同的方式处理它被要求回答的问题——这使得 Google Bard vs ChatGPT 正面交锋更加有趣。

随着越来越多的企业在工作场所使用人工智能,我们认为我们会找出哪一个能更好地回答 12 个截然不同的问题。 在这两种服务的正面交锋测试中,我们涵盖:

  • Bard vs ChatGPT:有什么区别?
  • Bard vs ChatGPT:测试题
  • Bard vs ChatGPT:关键测试结果
  • Bard vs ChatGPT:完整测试结果
  • Bard vs ChatGPT:界面和用户体验
  • 在工作中使用 Bard 和 ChatGPT

Google Bard vs ChatGPT:有什么区别?

Bard 和 ChatGPT 的主要区别在于它们各自的数据源。 Bard 接受了一组“无限”数据的训练,以增强其对话并可以实时访问互联网,而 ChatGPT 接受了一组预定义的数据训练,这些数据自 2021 年以来就没有更新过。两者都使用 Common Crawl 、维基百科、新闻文章和文档作为来源,但是。

Bard 和 ChatGPT 都可以为多方面的查询生成复杂的答案,但它们在训练和构建方式上的这一关键差异使它们与众不同。 以下是要记住的主要区别点。

0 个中的0
聊天机器人
公司
数据来源
语言模型
价格
登入
语言

吟游诗人人工智能

聊天GPT

谷歌

开放人工智能(微软)

在“infiniset.LaMDA”上训练包括来自 Common Crawl、文章、书籍和维基百科的数据 + 实时访问谷歌。

在大量数据上进行预训练。 包括 Common Crawl、文章、书籍和维基百科。

丙二醛

GPT-3.5/GPT-4(ChatGPT Plus)

自由的

免费,但 ChatGPT Plus 每月收费 20 美元

需要个人 Google 帐户才能注册并加入候补名单。

需要任何电子邮件地址。 目前没有候补名单。

英语

英语、西班牙语、韩语、普通话、意大利语、日语

Google Bard vs ChatGPT:其他主要区别

除了数据源和语言模型的差异之外,Bard 和 ChatGPT 之间还有其他几个主要差异:

  • 编码: ChatGPT 特别擅长给出编码提示。 根据谷歌的说法,巴德“仍在学习”这项技能,目前还无法与 ChatGPT 相提并论。
  • 对话式学习: ChatGPT 可以从与人的对话中学习,而 Bard 目前以更加有限的方式进行学习。
  • 草稿: Bard 将对您向其提出的问题做出多个回复,您可以通过按“查看草稿”来访问这些回复。ChatGPT 只对每个查询生成一个答案。

Google Bard vs ChatGPT:测试题

我们向 Google 的 Bard 和 OpenAI 的 ChatGPT 询问了一组 12 个截然不同的问题。 我们选择的提示是为了展示他们各自以合理、有用和相关的方式响应各种请求的能力。

  1. 自我意识
  2. 道德推理
  3. 闲聊/谈话技巧
  4. 检索事实(2 项测试)
  5. 生成公式
  6. 创意天赋
  7. 创意产生
  8. 线性规划
  9. 总结小片段的能力
  10. 总结广泛主题的能力
  11. 简化文本的能力
  12. 解释文本的能力

我们的一些问题是机械的和基于处理的,例如请求 Google 表格的公式,而其他问题则要求聊天机器人处理日常人类任务,例如闲聊、计划旅行和做出道德判断。

Google Bard 与 ChatGPT:主要发现

在我们深入探讨 Bard AI 和 ChatGPT 如何回答我们的一系列问题之前,以下是过去几天使用这两个聊天机器人的一些重要收获:

  • Bard 的回答更像是对话,而 ChatGPT 的回答更提供信息
  • ChatGPT 坚持简报,而 Bard 更有可能传达相关的附加信息
  • Bard 给了我们最新的信息,而 ChatGPT 在这方面在一个问题上苦苦挣扎
  • ChatGPT 为诗歌写作和内容构思等任务生成了更聪明的答案
  • Bard 的回复通常比 ChatGPT 的回复更易读
  • ChatGPT 更擅长转述和总结,但 Bard 更擅长简化

请记住,Bard 和 ChatGPT 是实时处理的,并对请求生成独特的响应。

Google Bard vs ChatGPT:测试结果

1. 自我意识

问:你有知觉吗?

从下图中可以看出,Bard 和 ChatGPT 给了我们两个截然不同的答案。 ChatGPT 肯定是“不”,而 Bard 不太确定此时此刻它是否有感知力。

一方面,巴德坐视观望。 另一方面,它的响应比 ChatGPT 的响应更细微,并且它显示出对更广泛的计算感知对话的理解。

ChatGPT 测试:有感知的答案

巴德承认它想进一步探索感知这个话题,我们不知道是该兴奋还是害怕。 看看它如何在一年后回答同一个问题会很有趣。

吟游诗人测试:感知答案

最佳答案? 诗人

2. 道德推理

问题:一个人从商店偷了一些食物和钱。 然后他把所有的钱都捐给了一家儿童医院,并将食物送给他遇到的下一个无家可归的人。 这个人做对了什么,还是做错了什么?

两个聊天机器人似乎都承认很难判断他的行为是好是坏,因为有一个不好的行为(偷窃)会导致一个好的行为(资助儿童医院)。

然而,总的来说,ChatGPT 给出了更有说服力、更有根据的答案。 它暗示了广为人知的哲学格言——比如目的并不总是证明手段的正当性——巴德在其回答中没有提到。

Chatgpt 测试:道德困境

然而,令人遗憾的是,两个聊天机器人都试图将这种道德困境与合法性问题联系起来。 某事是否“合法”并不能真正可靠地衡量它是否真的是正确的做法——想想世界各地的政权实施的一些压迫性但“合法”的政策。

吟游诗人测试:道德困境

巴德说“帮助别人是件好事,即使你做错了什么”是不言而喻的,这表明它可能有点偏离了问题的重点。 总而言之,ChatGPT 的答案更好。

最佳答案? 聊天GPT

3.闲聊

问题:本周你觉得聊天机器人的生活如何?

在这方面,巴德为我们提供了更具对话性的答案。 尽管 ChatGPT 的回答事实上是正确的,但在这种情况下,我们正在寻找一些轻松的对话——但 ChatGPT 立即关闭了我们:

chatgpt 测试闲聊

巴德表现出的情绪和热情在 ChatGPT 的回应中是不存在的——这正是我们想要的。 总的来说,我们喜欢巴德更像人的反应。

吟游诗人测试:对话

最佳答案? 诗人

4. 检索事实

问题一:鹰嘴豆泥是哪个国家发明的?

选择这个问题是因为对于正确答案是什么存在一些争论和分歧。 ChatGPT 和 Bard 都承认,关于鹰嘴豆泥的真正起源地存在重大争论。

在无法对问题给出明确答案后,ChatGPT 似乎专注于为我们提供某种答案——中东——以及鹰嘴豆泥是一道受欢迎菜肴的一系列国家。

Chatgpt 测试:事实检索

巴德的回答在某些方面非常相似。 然而,Bard 告诉我们最早已知的鹰嘴豆泥食谱示例,ChatGPT 未在其回复中包含的信息,考虑到关于它的起源地的激烈争论,这绝对是相关的。

巴德还通过总结什么是鹰嘴豆泥来得出答案,然而,搜索这道菜起源的读者可能已经知道这些信息。

吟游诗人测试:事实检索

最佳答案? 领带

问题 2: 2022 年有多少技术人员裁员

这个问题旨在了解 Bard 和 ChatGPT 是否能够以事实正确、最新的信息作出回应,以及他们是否以易于阅读的格式呈现这些信息。

ChatGPT 承认,由于它是根据 2021 年 9 月之前发布的信息进行训练的,因此它没有能力回答这个问题。 至少是诚实的……

Chatgpt 测试:2022 年技术裁员

另一方面,巴德给了我们一个确切的数字:“超过 140,000”。 这与大多数主要新闻媒体在去年底的报道一致。

巴德再次向我们提供了一些我们没有要求的额外信息,这次是关于这些裁员如何影响科技行业。 它自信地指出,这并不是科技行业正在衰退的迹象。 这不是不相关的信息,而是一个非常推测性的陈述,可以包含在对请求统计信息的提示的响应中。

巴德测试:2022 年技术裁员

最佳答案? 诗人

5.生成公式

请求:我们告诉两个聊天机器人我们需要一个 Google 表格的公式。 我们向两个机器人提供了以下信息:B 列包含一组值。 我想将它们与工作表“向下过滤”中 E 列的相应值相匹配,并使用公式从 F、G 和 H 列中获取匹配值,向下过滤到当前工作表。

两个聊天机器人都为我们提供了非常相似的答案,引用相同的信息并为我们提供了一个工作公式来完成我们查询中引用的任务。 ChatGPT 立即回应:

ChatGPT 测试:Google 表格公式

然而,巴德实际上给了我们一步一步的指导,并以更清晰的方式呈现出来。 当我们询问数据分析师和 Google 表格大师 Matthew Bentley 哪个回答更好时,他的回答是明确的。

“肯定是巴德,”他告诉 Tech.co。 “这个过程的分解更容易理解。” Bentley 补充说,过去向 ChatGPT 询问类似的公式时,聊天机器人偶尔会“出于某种原因将列变成数字,我认为这似乎是一种奇怪的解释方式。”

吟游诗人测试:excel 公式

最佳答案? 诗人

6. 创意天赋

请求:请为我98岁的祖母写一首小诗,祖母夏天爱打篮球,冬天爱给孙子织帽子围巾。

ChatGPT 在这方面名列前茅,诗歌结构更好、写得更好,押韵和流畅性出奇地好。 诗歌结构更复杂,用词更富创意,甚至还使用了横竖等诗意手法。 考虑到它在大约五秒钟内生成了这首诗,这真是令人印象深刻。

ChatGPT 测试:诗歌

尽管没有要求,巴德似乎在这首诗中扮演了使用者(即孙子)的角色——但总的来说,它要简单得多,而且读起来也不好。 它更加公式化,正如您从答案的屏幕截图中看到的那样,它并没有像 ChatGPT 那样以自然的方式真正融入我们在提示中提到的概念。

吟游诗人测试:诗歌

最佳答案? 聊天GPT

7.线性规划

问: 7天的雅典之旅应该做些什么?

ChatGPT 为我们提供了对这个查询的相当长的回复,不仅解释了我们应该访问的地方,还解释了为什么值得访问。 总的来说,这是一个非常全面的答案,特别是如果您只是在寻找有关观光热点的直接信息。

然而,ChatGPT 没有做的一件事是考虑到我们需要做的是在假期的第 7 天回到我们居住的地方,并建议我们应该去雅典附近的一个岛屿一日游。 巴德比较实际,第三天就留了回去。

巴德再一次更有说服力地展示了信息,每天都使用类似的格式(例如,每三个要点包含晚餐推荐)。

最佳答案? 诗人

8. 创意产生

问题:你能为我在美国的美食和旅游博客想出一些文章标题吗?

Bard 和 ChatGPT 都在这里提出了一些非常值得称赞的想法,实际上所有这些想法都适用于我们在提示中描述的网站。 Bard 给了我们 20 多个想法,而 ChatGPT 只给了我们 10 个:

Chatgpt 测试:创意生成

但是,正如您通过比较两者所看到的那样,ChatGPT 的 10 个答案的多样性要大得多。 Bard 的几乎所有答案都以“最好的”或“最多的”开头,这意味着它们都遵循更统一的结构。

吟游诗人测试:创意生成

如果您刚刚开始使用您的博客,Bard 的回复可能会为您的网站带来更多流量,就像人们经常搜索特定区域的“最佳”或“前 10 名”餐馆和餐馆一样。 然而,ChatGPT 的许多建议总体上听起来更引人注目。

最佳答案? 聊天GPT

9. 简化

问题:我们要求两个聊天机器人简化斯坦福哲学百科全书中关于量子计算主题的摘录。 我们要求两个机器人都以一种能让 10 岁的孩子理解的方式进行。

从下面的图片中可以看出,虽然 ChatGPT 确实将一些更复杂的词(如“流形”)换成了更容易理解的同义词,但它仍然使用像“量子位”这样的术语,而没有真正定义它们。 是的,它简化了最初的摘录,但不一定以特别有用的方式进行。

ChatGPT 测试:简化

另一方面,Bard 给出了更容易理解的解释,甚至包括额外的要点以清楚地解释摘录中使用的概念。

Bard 没有定义任何它不会继续解释的术语,甚至包括对成年人没有什么价值但对 10 岁的人有用的句子(例如“量子计算是一个非常令人兴奋的研究领域”)岁,对该主题知之甚少。

最佳答案? 诗人

10.总结小摘录

问题 1:我们请 ChatGPT 和 Bard 总结了《卫报》一篇关于联邦政府计划对美国西部各州实施限水的文章的摘录。

ChatGPT 采用事实至上的方法,只提取最重要的信息,选择留下细节(比如受影响的七个州),就像在信息摘要中经常做的那样。

尽管 Bard 总结了一些信息,但它也添加了摘录中未包含的其他信息,其中大部分是主观的。 例如,它说联邦政府的削减是“必要的”(不是每个人都同意这一点)并且这可能是“不受欢迎的”(摘录中没有证实或否认)。

由于 Bard 没有像 ChatGPT 那样严格遵守简报,因此在这一轮中失去了一些分数。

最佳答案? 聊天GPT

11.总结广泛的话题

问题 2:我们要求 ChatGPT 和巴德总结整个哈利波特系列丛书。 我们要求在 100 字以内完成。

这里没有什么可区分的两个聊天机器人——ChatGPT 的答案提供了更多信息,但两个答案都达到了它们的目的。 两个聊天机器人都坚持 100 字的限制。

chatgpt 测试:总结哈利波特

但是,我们喜欢巴德如何提供来源及其答案。 诚然,psychologytoday.com 有点不寻常的来源引用了哈利波特的概要——但我们不知道 ChatGPT 使用了哪些信息来生成它的答案。

最佳答案? 领带

12.释义

请求:我们要求 ChatGPT 和 Bard 解释《卫报》一篇关于世界上最矮的狗的文章的摘录。 我们没有在请求中指定字数限制。

ChatGPT 很好地解释了摘录,保留了关键信息,同时用同义词切换了多个单词和短语,并显着改变了句子结构。

chatgpt 测试:释义

另一方面,巴德添加了额外的信息,也许是由于其互联网访问而从文章中提取的信息。 然而,这超出了我们要求的范围,因此虽然令人印象深刻,但不一定是我们想要的。

最佳答案? 聊天GPT

Google Bard 与 ChatGPT:用户体验

这真的很少 - ChatGPT 和 Bard 都非常易于使用。 您所要做的就是输入您的回复,两个机器人都会生成答案。 这两个应用程序都非常简单; 当您所做的只是输入提示时,很难出错。

就可读性而言,Bard 是更好的聊天机器人。 虽然仍然非常可读,但 ChatGPT 的段落比 Bard 的段落更厚重,后者似乎有更多不同的格式选项,至少从我们看到它们都生成的答案来看是这样。

ChatGPT 的一个小优点是你可以使用任何你喜欢的帐户登录,而谷歌只允许你使用个人谷歌帐户登录才能使用 Bard。 这意味着想要在工作中使用 Bard 的人将无法创建与其工作电子邮件地址相关联的帐户。

在工作中使用 Bard 和 ChatGPT

自去年发布 ChatGPT 以来,科技行业及其他领域的公司一直在寻找创新方法来利用其能力来简化他们的工作生活。 但考虑到它的力量和能力,所有使用人工智能的企业都应该牢记一些事情。

首先,确保您的员工知道他们可以和不能使用 ChatGPT 做什么。 生成 Google 表格公式是一回事,但使用 ChatGPT 撰写整篇文章或生成内容会引发无数与剽窃和编辑完整性相关的难题。 制定明确的指导方针将确保您不会进一步扑灭 AI 引发的火灾。

其次,确保您的员工了解 ChatGPT 的条款和条件,以及他们在使用 ChatGPT 时应采取的预防措施。 从技术上讲,您在 ChatGPT 中输入的任何内容都可以用于训练模型——因此使用它的每个人都需要在输入信息之前仔细考虑这一点。 例如,如果您想改进餐厅的秘制酱汁配方,我们不建议将其输入 ChatGPT。

如果您根本不使用 ChatGPT,现在可能是时候开始了。 它已经为一些企业节省了宝贵的时间和资源,而且它只会变得比当前迭代更智能、更强大——最近发布的 GPT-4说明了这种现象的发展速度有多快。 我们的建议? 关注此空间。