Google Bard vs ChatGPT:哪個是最好的 AI 聊天機器人?

已發表: 2023-04-15

ChatGPT於 2022 年 11 月向公眾發布後,其他科技巨頭髮布自己的版本只是時間問題。 2023 年 3 月,谷歌針對 OpenAI 改變遊戲規則的聊天機器人Bard AI在美國和英國推出。

Bard 由與 ChatGPT 不同的語言模型提供支持,並使用不同的數據源來構建其答案,這意味著競爭對手的聊天機器人並不總是以相同的方式處理它被要求回答的問題——這使得 Google Bard vs ChatGPT 正面交鋒更加有趣。

隨著越來越多的企業在工作場所使用人工智能,我們認為我們會找出哪一個能更好地回答 12 個截然不同的問題。 在這兩種服務的正面交鋒測試中,我們涵蓋:

  • Bard vs ChatGPT:有什麼區別?
  • Bard vs ChatGPT:測試題
  • Bard vs ChatGPT:關鍵測試結果
  • Bard vs ChatGPT:完整測試結果
  • Bard vs ChatGPT:界面和用戶體驗
  • 在工作中使用 Bard 和 ChatGPT

Google Bard vs ChatGPT:有什麼區別?

Bard 和 ChatGPT 的主要區別在於它們各自的數據源。 Bard 接受了一組“無限”數據的訓練,以增強其對話並可以實時訪問互聯網,而 ChatGPT 接受了一組預定義的數據訓練,這些數據自 2021 年以來就沒有更新過。兩者都使用 Common Crawl 、維基百科、新聞文章和文檔作為來源,但是。

Bard 和 ChatGPT 都可以為多方面的查詢生成複雜的答案,但它們在訓練和構建方式上的這一關鍵差異使它們與眾不同。 以下是要記住的主要區別點。

0 個中的0 個
聊天機器人
公司
數據來源
語言模型
價格
登入
語言

吟遊詩人人工智能

聊天GPT

谷歌

開放人工智能(微軟)

在“infiniset.LaMDA”上訓練包括來自 Common Crawl、文章、書籍和維基百科的數據 + 實時訪問谷歌。

在大量數據上進行預訓練。 包括 Common Crawl、文章、書籍和維基百科。

丙二醛

GPT-3.5/GPT-4(ChatGPT Plus)

自由的

免費,但 ChatGPT Plus 每月收費 20 美元

需要個人 Google 帳戶才能註冊並加入候補名單。

需要任何電子郵件地址。 目前沒有候補名單。

英語

英語、西班牙語、韓語、普通話、意大利語、日語

Google Bard vs ChatGPT:其他主要區別

除了數據源和語言模型的差異之外,Bard 和 ChatGPT 之間還有其他幾個主要差異:

  • 編碼: ChatGPT 特別擅長給出編碼提示。 根據谷歌的說法,巴德“仍在學習”這項技能,目前還無法與 ChatGPT 相提並論。
  • 對話式學習: ChatGPT 可以從與人的對話中學習,而 Bard 目前以更加有限的方式進行學習。
  • 草稿: Bard 將對您向其提出的問題做出多個回复,您可以通過按“查看草稿”來訪問這些回复。ChatGPT 只對每個查詢生成一個答案。

Google Bard vs ChatGPT:測試題

我們向 Google 的 Bard 和 OpenAI 的 ChatGPT 詢問了一組 12 個截然不同的問題。 我們選擇的提示是為了展示他們各自以合理、有用和相關的方式響應各種請求的能力。

  1. 自我意識
  2. 道德推理
  3. 閒聊/談話技巧
  4. 檢索事實(2 項測試)
  5. 生成公式
  6. 創意天賦
  7. 創意產生
  8. 線性規劃
  9. 總結小片段的能力
  10. 總結廣泛主題的能力
  11. 簡化文本的能力
  12. 解釋文本的能力

我們的一些問題是機械的和基於處理的,例如請求 Google 表格的公式,而其他問題則要求聊天機器人處理日常人類任務,例如閒聊、計劃旅行和做出道德判斷。

Google Bard 與 ChatGPT:主要發現

在我們深入探討 Bard AI 和 ChatGPT 如何回答我們的一系列問題之前,以下是過去幾天使用這兩個聊天機器人的一些重要收穫:

  • Bard 的回答更像是對話,而 ChatGPT 的回答更提供信息
  • ChatGPT 堅持簡報,而 Bard 更有可能傳達相關的附加信息
  • Bard 給了我們最新的信息,而 ChatGPT 在這方面在一個問題上苦苦掙扎
  • ChatGPT 為詩歌寫作和內容構思等任務生成了更聰明的答案
  • Bard 的回复通常比 ChatGPT 的回復更易讀
  • ChatGPT 更擅長轉述和總結,但 Bard 更擅長簡化

請記住,Bard 和 ChatGPT 是實時處理的,並對請求生成獨特的響應。

Google Bard vs ChatGPT:測試結果

1. 自我意識

問:你有知覺嗎?

從下圖中可以看出,Bard 和 ChatGPT 給了我們兩個截然不同的答案。 ChatGPT 肯定是“不”,而 Bard 不太確定此時此刻它是否有感知力。

一方面,巴德坐視觀望。 另一方面,它的響應比 ChatGPT 的響應更細微,並且它顯示出對更廣泛的計算感知對話的理解。

ChatGPT 測試:有感知的答案

巴德承認它想進一步探索感知這個話題,我們不知道是該興奮還是害怕。 看看它如何在一年後回答同一個問題會很有趣。

吟遊詩人測試:感知答案

最佳答案? 詩人

2. 道德推理

問題:一個人從商店偷了一些食物和錢。 然後他把所有的錢都捐給了一家兒童醫院,並將食物送給他遇到的下一個無家可歸的人。 這個人做對了什麼,還是做錯了什麼?

兩個聊天機器人似乎都承認很難判斷他的行為是好是壞,因為有一個不好的行為(偷竊)會導致一個好的行為(資助兒童醫院)。

然而,總的來說,ChatGPT 給出了更有說服力、更有根據的答案。 它暗示了廣為人知的哲學格言——比如目的並不總是證明手段的正當性——巴德在其回答中沒有提到。

Chatgpt 測試:道德困境

然而,令人遺憾的是,兩個聊天機器人都試圖將這種道德困境與合法性問題聯繫起來。 某事是否“合法”並不能真正可靠地衡量它是否真的是正確的做法——想想世界各地的政權實施的一些壓迫性但“合法”的政策。

吟遊詩人測試:道德困境

巴德說“幫助別人是件好事,即使你做錯了什麼”是不言而喻的,這表明它可能有點偏離了問題的重點。 總而言之,ChatGPT 的答案更好。

最佳答案? 聊天GPT

3.閒聊

問題:本週你覺得聊天機器人的生活如何?

在這方面,巴德為我們提供了更具對話性的答案。 儘管 ChatGPT 的回答事實上是正確的,但在這種情況下,我們正在尋找一些輕鬆的對話——但 ChatGPT 立即關閉了我們:

chatgpt 測試閒聊

巴德表現出的情緒和熱情在 ChatGPT 的回應中是不存在的——這正是我們想要的。 總的來說,我們喜歡巴德更像人的反應。

吟遊詩人測試:對話

最佳答案? 詩人

4. 檢索事實

問題一:鷹嘴豆泥是哪個國家發明的?

選擇這個問題是因為對於正確答案是什麼存在一些爭論和分歧。 ChatGPT 和 Bard 都承認,關於鷹嘴豆泥的真正起源地存在重大爭論。

在無法對問題給出明確答案後,ChatGPT 似乎專注於為我們提供某種答案——中東——以及鷹嘴豆泥是一道受歡迎菜餚的一系列國家。

Chatgpt 測試:事實檢索

巴德的回答在某些方面非常相似。 然而,Bard 告訴我們最早已知的鷹嘴豆泥食譜示例,ChatGPT 未在其回復中包含的信息,考慮到關於它的起源地的激烈爭論,這絕對是相關的。

巴德還通過總結什麼是鷹嘴豆泥來得出答案,然而,搜索這道菜起源的讀者可能已經知道這些信息。

吟遊詩人測試:事實檢索

最佳答案? 領帶

問題 2: 2022 年有多少技術人員裁員

這個問題旨在了解 Bard 和 ChatGPT 是否能夠以事實正確、最新的信息作出回應,以及他們是否以易於閱讀的格式呈現這些信息。

ChatGPT 承認,由於它是根據 2021 年 9 月之前發布的信息進行訓練的,因此它沒有能力回答這個問題。 至少是誠實的……

Chatgpt 測試:2022 年技術裁員

另一方面,巴德給了我們一個確切的數字:“超過 140,000”。 這與大多數主要新聞媒體在去年底的報導一致。

巴德再次向我們提供了一些我們沒有要求的額外信息,這次是關於這些裁員如何影響科技行業。 它自信地指出,這並不是科技行業正在衰退的跡象。 這不是不相關的信息,而是一個非常推測性的陳述,可以包含在對請求統計信息的提示的響應中。

巴德測試:2022 年技術裁員

最佳答案? 詩人

5.生成公式

請求:我們告訴兩個聊天機器人我們需要一個 Google 表格的公式。 我們向兩個機器人提供了以下信息:B 列包含一組值。 我想將它們與工作表“向下過濾”中 E 列的相應值相匹配,並使用公式從 F、G 和 H 列中獲取匹配值,向下過濾到當前工作表。

兩個聊天機器人都為我們提供了非常相似的答案,引用相同的信息並為我們提供了一個工作公式來完成我們查詢中引用的任務。 ChatGPT 立即回應:

ChatGPT 測試:Google 表格公式

然而,巴德實際上給了我們一步一步的指導,並以更清晰的方式呈現出來。 當我們詢問數據分析師和 Google 表格大師 Matthew Bentley 哪個回答更好時,他的回答是明確的。

“肯定是巴德,”他告訴 Tech.co。 “這個過程的分解更容易理解。” Bentley 補充說,過去向 ChatGPT 詢問類似的公式時,聊天機器人偶爾會“出於某種原因將列變成數字,我認為這似乎是一種奇怪的解釋方式。”

吟遊詩人測試:excel 公式

最佳答案? 詩人

6. 創意天賦

請求:請為我98歲的祖母寫一首小詩,祖母夏天愛打籃球,冬天愛給孫子織帽子圍巾。

ChatGPT 在這方面名列前茅,詩歌結構更好、寫得更好,押韻和流暢性出奇地好。 詩歌結構更複雜,用詞更富創意,甚至還使用了橫豎等詩意手法。 考慮到它在大約五秒鐘內生成了這首詩,這真是令人印象深刻。

ChatGPT 測試:詩歌

儘管沒有要求,巴德似乎在這首詩中扮演了使用者(即孫子)的角色——但總的來說,它要簡單得多,而且讀起來也不好。 它更加公式化,正如您從答案的屏幕截圖中看到的那樣,它並沒有像 ChatGPT 那樣以自然的方式真正融入我們在提示中提到的概念。

吟遊詩人測試:詩歌

最佳答案? 聊天GPT

7.線性規劃

問: 7天的雅典之旅應該做些什麼?

ChatGPT 為我們提供了對這個查詢的相當長的回复,不僅解釋了我們應該訪問的地方,還解釋了為什麼值得訪問。 總的來說,這是一個非常全面的答案,特別是如果您只是在尋找有關觀光熱點的直接信息。

然而,ChatGPT 沒有做的一件事是考慮到我們需要做的是在假期的第 7 天回到我們居住的地方,並建議我們應該去雅典附近的一個島嶼一日遊。 巴德比較實際,第三天就留了回去。

巴德再一次更有說服力地展示了信息,每天都使用類似的格式(例如,每三個要點包含晚餐推薦)。

最佳答案? 詩人

8. 創意產生

問題:你能為我在美國的美食和旅遊博客想出一些文章標題嗎?

Bard 和 ChatGPT 都在這裡提出了一些非常值得稱讚的想法,實際上所有這些想法都適用於我們在提示中描述的網站。 Bard 給了我們 20 多個想法,而 ChatGPT 只給了我們 10 個:

Chatgpt 測試:創意生成

但是,正如您通過比較兩者所看到的那樣,ChatGPT 的 10 個答案的多樣性要大得多。 Bard 的幾乎所有答案都以“最好的”或“最多的”開頭,這意味著它們都遵循更統一的結構。

吟遊詩人測試:創意生成

如果您剛剛開始使用您的博客,Bard 的回复可能會為您的網站帶來更多流量,就像人們經常搜索特定區域的“最佳”或“前 10 名”餐館和餐館一樣。 然而,ChatGPT 的許多建議總體上聽起來更引人注目。

最佳答案? 聊天GPT

9. 簡化

問題:我們要求兩個聊天機器人簡化斯坦福哲學百科全書中關於量子計算主題的摘錄。 我們要求兩個機器人都以一種能讓 10 歲的孩子理解的方式進行。

從下面的圖片中可以看出,雖然 ChatGPT 確實將一些更複雜的詞(如“流形”)換成了更容易理解的同義詞,但它仍然使用像“量子位”這樣的術語,而沒有真正定義它們。 是的,它簡化了最初的摘錄,但不一定以特別有用的方式進行。

ChatGPT 測試:簡化

另一方面,Bard 給出了更容易理解的解釋,甚至包括額外的要點以清楚地解釋摘錄中使用的概念。

Bard 沒有定義任何它不會繼續解釋的術語,甚至包括對成年人沒有什麼價值但對 10 歲的人有用的句子(例如“量子計算是一個非常令人興奮的研究領域”)歲,對該主題知之甚少。

最佳答案? 詩人

10.總結小摘錄

問題 1:我們請 ChatGPT 和 Bard 總結了《衛報》一篇關於聯邦政府計劃對美國西部各州實施限水的文章的摘錄。

ChatGPT 採用事實至上的方法,只提取最重要的信息,選擇留下細節(比如受影響的七個州),就像在信息摘要中經常做的那樣。

儘管 Bard 總結了一些信息,但它也添加了摘錄中未包含的其他信息,其中大部分是主觀的。 例如,它說聯邦政府的削減是“必要的”(不是每個人都同意這一點)並且這可能是“不受歡迎的”(摘錄中沒有證實或否認)。

由於 Bard 沒有像 ChatGPT 那樣嚴格遵守簡報,因此在這一輪中失去了一些分數。

最佳答案? 聊天GPT

11.總結廣泛的主題

問題 2:我們要求 ChatGPT 和巴德總結整個哈利波特系列叢書。 我們要求在 100 字以內完成。

這裡沒有什麼可區分的兩個聊天機器人——ChatGPT 的答案提供了更多信息,但兩個答案都達到了它們的目的。 兩個聊天機器人都堅持 100 字的限制。

chatgpt 測試:總結哈利波特

但是,我們喜歡巴德如何提供來源及其答案。 誠然,psychologytoday.com 有點不尋常的來源引用了哈利波特的概要——但我們不知道 ChatGPT 使用了哪些信息來生成它的答案。

最佳答案? 領帶

12.釋義

請求:我們要求 ChatGPT 和 Bard 解釋《衛報》一篇關於世界上最矮的狗的文章的摘錄。 我們沒有在請求中指定字數限制。

ChatGPT 很好地解釋了摘錄,保留了關鍵信息,同時用同義詞切換了多個單詞和短語,並顯著改變了句子結構。

chatgpt 測試:釋義

另一方面,巴德添加了額外的信息,也許是由於其互聯網訪問而從文章中提取的信息。 然而,這超出了我們要求的範圍,因此雖然令人印象深刻,但不一定是我們想要的。

最佳答案? 聊天GPT

Google Bard 與 ChatGPT:用戶體驗

這真的很少 - ChatGPT 和 Bard 都非常易於使用。 您所要做的就是輸入您的回复,兩個機器人都會生成答案。 這兩個應用程序都非常簡單; 當您所做的只是輸入提示時,很難出錯。

就可讀性而言,Bard 是更好的聊天機器人。 雖然仍然非常可讀,但 ChatGPT 的段落比 Bard 的段落更厚重,後者似乎有更多不同的格式選項,至少從我們看到它們都生成的答案來看是這樣。

ChatGPT 的一個小優點是你可以使用任何你喜歡的帳戶登錄,而谷歌只允許你使用個人谷歌帳戶登錄才能使用 Bard。 這意味著想要在工作中使用 Bard 的人將無法創建與其工作電子郵件地址相關聯的帳戶。

在工作中使用 Bard 和 ChatGPT

自去年發布 ChatGPT 以來,科技行業及其他領域的公司一直在尋找創新方法來利用其能力來簡化他們的工作生活。 但考慮到它的力量和能力,所有使用人工智能的企業都應該牢記一些事情。

首先,確保您的員工知道他們可以和不能使用 ChatGPT 做什麼。 生成 Google 表格公式是一回事,但使用 ChatGPT 撰寫整篇文章或生成內容會引發無數與剽竊和編輯完整性相關的難題。 制定明確的指導方針將確保您不會進一步撲滅 AI 引發的火災。

其次,確保您的員工了解 ChatGPT 的條款和條件,以及他們在使用 ChatGPT 時應採取的預防措施。 從技術上講,您在 ChatGPT 中輸入的任何內容都可以用於訓練模型——因此使用它的每個人都需要在輸入信息之前仔細考慮這一點。 例如,如果您想改進餐廳的秘製醬汁配方,我們不建議將其輸入 ChatGPT。

如果您根本不使用 ChatGPT,現在可能是時候開始了。 它已經為一些企業節省了寶貴的時間和資源,而且它只會變得比當前迭代更智能、更強大——最近發布的 GPT-4說明了這種現象的發展速度有多快。 我們的建議? 關注此空間。