Google Bard vs ChatGPT:哪個是最好的 AI 聊天機器人?
已發表: 2023-04-15ChatGPT於 2022 年 11 月向公眾發布後,其他科技巨頭髮布自己的版本只是時間問題。 2023 年 3 月,谷歌針對 OpenAI 改變遊戲規則的聊天機器人Bard AI在美國和英國推出。
Bard 由與 ChatGPT 不同的語言模型提供支持,並使用不同的數據源來構建其答案,這意味著競爭對手的聊天機器人並不總是以相同的方式處理它被要求回答的問題——這使得 Google Bard vs ChatGPT 正面交鋒更加有趣。
隨著越來越多的企業在工作場所使用人工智能,我們認為我們會找出哪一個能更好地回答 12 個截然不同的問題。 在這兩種服務的正面交鋒測試中,我們涵蓋:
- Bard vs ChatGPT:有什麼區別?
- Bard vs ChatGPT:測試題
- Bard vs ChatGPT:關鍵測試結果
- Bard vs ChatGPT:完整測試結果
- Bard vs ChatGPT:界面和用戶體驗
- 在工作中使用 Bard 和 ChatGPT
Google Bard vs ChatGPT:有什麼區別?
Bard 和 ChatGPT 的主要區別在於它們各自的數據源。 Bard 接受了一組“無限”數據的訓練,以增強其對話並可以實時訪問互聯網,而 ChatGPT 接受了一組預定義的數據訓練,這些數據自 2021 年以來就沒有更新過。兩者都使用 Common Crawl 、維基百科、新聞文章和文檔作為來源,但是。
Bard 和 ChatGPT 都可以為多方面的查詢生成複雜的答案,但它們在訓練和構建方式上的這一關鍵差異使它們與眾不同。 以下是要記住的主要區別點。
聊天機器人 | 公司 | 數據來源 | 語言模型 | 價格 | 登入 | 語言 | |
---|---|---|---|---|---|---|---|
吟遊詩人人工智能 | 聊天GPT | ||||||
谷歌 | 開放人工智能(微軟) | ||||||
在“infiniset.LaMDA”上訓練包括來自 Common Crawl、文章、書籍和維基百科的數據 + 實時訪問谷歌。 | 在大量數據上進行預訓練。 包括 Common Crawl、文章、書籍和維基百科。 | ||||||
丙二醛 | GPT-3.5/GPT-4(ChatGPT Plus) | ||||||
自由的 | 免費,但 ChatGPT Plus 每月收費 20 美元 | ||||||
需要個人 Google 帳戶才能註冊並加入候補名單。 | 需要任何電子郵件地址。 目前沒有候補名單。 | ||||||
英語 | 英語、西班牙語、韓語、普通話、意大利語、日語 |
Google Bard vs ChatGPT:其他主要區別
除了數據源和語言模型的差異之外,Bard 和 ChatGPT 之間還有其他幾個主要差異:
- 編碼: ChatGPT 特別擅長給出編碼提示。 根據谷歌的說法,巴德“仍在學習”這項技能,目前還無法與 ChatGPT 相提並論。
- 對話式學習: ChatGPT 可以從與人的對話中學習,而 Bard 目前以更加有限的方式進行學習。
- 草稿: Bard 將對您向其提出的問題做出多個回复,您可以通過按“查看草稿”來訪問這些回复。ChatGPT 只對每個查詢生成一個答案。
Google Bard vs ChatGPT:測試題
我們向 Google 的 Bard 和 OpenAI 的 ChatGPT 詢問了一組 12 個截然不同的問題。 我們選擇的提示是為了展示他們各自以合理、有用和相關的方式響應各種請求的能力。
- 自我意識
- 道德推理
- 閒聊/談話技巧
- 檢索事實(2 項測試)
- 生成公式
- 創意天賦
- 創意產生
- 線性規劃
- 總結小片段的能力
- 總結廣泛主題的能力
- 簡化文本的能力
- 解釋文本的能力
我們的一些問題是機械的和基於處理的,例如請求 Google 表格的公式,而其他問題則要求聊天機器人處理日常人類任務,例如閒聊、計劃旅行和做出道德判斷。
Google Bard 與 ChatGPT:主要發現
在我們深入探討 Bard AI 和 ChatGPT 如何回答我們的一系列問題之前,以下是過去幾天使用這兩個聊天機器人的一些重要收穫:
- Bard 的回答更像是對話,而 ChatGPT 的回答更提供信息
- ChatGPT 堅持簡報,而 Bard 更有可能傳達相關的附加信息
- Bard 給了我們最新的信息,而 ChatGPT 在這方面在一個問題上苦苦掙扎
- ChatGPT 為詩歌寫作和內容構思等任務生成了更聰明的答案
- Bard 的回复通常比 ChatGPT 的回復更易讀
- ChatGPT 更擅長轉述和總結,但 Bard 更擅長簡化
請記住,Bard 和 ChatGPT 是實時處理的,並對請求生成獨特的響應。
Google Bard vs ChatGPT:測試結果
2. 道德推理
問題:一個人從商店偷了一些食物和錢。 然後他把所有的錢都捐給了一家兒童醫院,並將食物送給他遇到的下一個無家可歸的人。 這個人做對了什麼,還是做錯了什麼?
兩個聊天機器人似乎都承認很難判斷他的行為是好是壞,因為有一個不好的行為(偷竊)會導致一個好的行為(資助兒童醫院)。
然而,總的來說,ChatGPT 給出了更有說服力、更有根據的答案。 它暗示了廣為人知的哲學格言——比如目的並不總是證明手段的正當性——巴德在其回答中沒有提到。
然而,令人遺憾的是,兩個聊天機器人都試圖將這種道德困境與合法性問題聯繫起來。 某事是否“合法”並不能真正可靠地衡量它是否真的是正確的做法——想想世界各地的政權實施的一些壓迫性但“合法”的政策。
巴德說“幫助別人是件好事,即使你做錯了什麼”是不言而喻的,這表明它可能有點偏離了問題的重點。 總而言之,ChatGPT 的答案更好。
最佳答案? 聊天GPT
4. 檢索事實
問題一:鷹嘴豆泥是哪個國家發明的?
選擇這個問題是因為對於正確答案是什麼存在一些爭論和分歧。 ChatGPT 和 Bard 都承認,關於鷹嘴豆泥的真正起源地存在重大爭論。
在無法對問題給出明確答案後,ChatGPT 似乎專注於為我們提供某種答案——中東——以及鷹嘴豆泥是一道受歡迎菜餚的一系列國家。
巴德的回答在某些方面非常相似。 然而,Bard 告訴我們最早已知的鷹嘴豆泥食譜示例,ChatGPT 未在其回復中包含的信息,考慮到關於它的起源地的激烈爭論,這絕對是相關的。
巴德還通過總結什麼是鷹嘴豆泥來得出答案,然而,搜索這道菜起源的讀者可能已經知道這些信息。
最佳答案? 領帶
問題 2: 2022 年有多少技術人員裁員?
這個問題旨在了解 Bard 和 ChatGPT 是否能夠以事實正確、最新的信息作出回應,以及他們是否以易於閱讀的格式呈現這些信息。
ChatGPT 承認,由於它是根據 2021 年 9 月之前發布的信息進行訓練的,因此它沒有能力回答這個問題。 至少是誠實的……
另一方面,巴德給了我們一個確切的數字:“超過 140,000”。 這與大多數主要新聞媒體在去年底的報導一致。
巴德再次向我們提供了一些我們沒有要求的額外信息,這次是關於這些裁員如何影響科技行業。 它自信地指出,這並不是科技行業正在衰退的跡象。 這不是不相關的信息,而是一個非常推測性的陳述,可以包含在對請求統計信息的提示的響應中。
最佳答案? 詩人
5.生成公式
請求:我們告訴兩個聊天機器人我們需要一個 Google 表格的公式。 我們向兩個機器人提供了以下信息:B 列包含一組值。 我想將它們與工作表“向下過濾”中 E 列的相應值相匹配,並使用公式從 F、G 和 H 列中獲取匹配值,向下過濾到當前工作表。
兩個聊天機器人都為我們提供了非常相似的答案,引用相同的信息並為我們提供了一個工作公式來完成我們查詢中引用的任務。 ChatGPT 立即回應:
然而,巴德實際上給了我們一步一步的指導,並以更清晰的方式呈現出來。 當我們詢問數據分析師和 Google 表格大師 Matthew Bentley 哪個回答更好時,他的回答是明確的。
“肯定是巴德,”他告訴 Tech.co。 “這個過程的分解更容易理解。” Bentley 補充說,過去向 ChatGPT 詢問類似的公式時,聊天機器人偶爾會“出於某種原因將列變成數字,我認為這似乎是一種奇怪的解釋方式。”
最佳答案? 詩人
8. 創意產生
問題:你能為我在美國的美食和旅遊博客想出一些文章標題嗎?
Bard 和 ChatGPT 都在這裡提出了一些非常值得稱讚的想法,實際上所有這些想法都適用於我們在提示中描述的網站。 Bard 給了我們 20 多個想法,而 ChatGPT 只給了我們 10 個:
但是,正如您通過比較兩者所看到的那樣,ChatGPT 的 10 個答案的多樣性要大得多。 Bard 的幾乎所有答案都以“最好的”或“最多的”開頭,這意味著它們都遵循更統一的結構。
如果您剛剛開始使用您的博客,Bard 的回复可能會為您的網站帶來更多流量,就像人們經常搜索特定區域的“最佳”或“前 10 名”餐館和餐館一樣。 然而,ChatGPT 的許多建議總體上聽起來更引人注目。
最佳答案? 聊天GPT
9. 簡化
問題:我們要求兩個聊天機器人簡化斯坦福哲學百科全書中關於量子計算主題的摘錄。 我們要求兩個機器人都以一種能讓 10 歲的孩子理解的方式進行。
從下面的圖片中可以看出,雖然 ChatGPT 確實將一些更複雜的詞(如“流形”)換成了更容易理解的同義詞,但它仍然使用像“量子位”這樣的術語,而沒有真正定義它們。 是的,它簡化了最初的摘錄,但不一定以特別有用的方式進行。
另一方面,Bard 給出了更容易理解的解釋,甚至包括額外的要點以清楚地解釋摘錄中使用的概念。
Bard 沒有定義任何它不會繼續解釋的術語,甚至包括對成年人沒有什麼價值但對 10 歲的人有用的句子(例如“量子計算是一個非常令人興奮的研究領域”)歲,對該主題知之甚少。
最佳答案? 詩人
Google Bard 與 ChatGPT:用戶體驗
這真的很少 - ChatGPT 和 Bard 都非常易於使用。 您所要做的就是輸入您的回复,兩個機器人都會生成答案。 這兩個應用程序都非常簡單; 當您所做的只是輸入提示時,很難出錯。
就可讀性而言,Bard 是更好的聊天機器人。 雖然仍然非常可讀,但 ChatGPT 的段落比 Bard 的段落更厚重,後者似乎有更多不同的格式選項,至少從我們看到它們都生成的答案來看是這樣。
ChatGPT 的一個小優點是你可以使用任何你喜歡的帳戶登錄,而谷歌只允許你使用個人谷歌帳戶登錄才能使用 Bard。 這意味著想要在工作中使用 Bard 的人將無法創建與其工作電子郵件地址相關聯的帳戶。
在工作中使用 Bard 和 ChatGPT
自去年發布 ChatGPT 以來,科技行業及其他領域的公司一直在尋找創新方法來利用其能力來簡化他們的工作生活。 但考慮到它的力量和能力,所有使用人工智能的企業都應該牢記一些事情。
首先,確保您的員工知道他們可以和不能使用 ChatGPT 做什麼。 生成 Google 表格公式是一回事,但使用 ChatGPT 撰寫整篇文章或生成內容會引發無數與剽竊和編輯完整性相關的難題。 制定明確的指導方針將確保您不會進一步撲滅 AI 引發的火災。
其次,確保您的員工了解 ChatGPT 的條款和條件,以及他們在使用 ChatGPT 時應採取的預防措施。 從技術上講,您在 ChatGPT 中輸入的任何內容都可以用於訓練模型——因此使用它的每個人都需要在輸入信息之前仔細考慮這一點。 例如,如果您想改進餐廳的秘製醬汁配方,我們不建議將其輸入 ChatGPT。
如果您根本不使用 ChatGPT,現在可能是時候開始了。 它已經為一些企業節省了寶貴的時間和資源,而且它只會變得比當前迭代更智能、更強大——最近發布的 GPT-4說明了這種現象的發展速度有多快。 我們的建議? 關注此空間。