ChatGPT 統計數據 2023有關 OpenAI 聊天機器人的所有最新統計數據

已發表: 2023-02-15

自推出以來,ChatGPT 作為一款類人聊天機器人,根據用戶輸入的內容做出回應,迅速走紅。

該工具能夠根據 3000 億個單字和 1750 億個參數的資料集回答問題並產生回應。 它肯定會成為業務成長和效率最大化的關鍵工具。

我們根據最新數據和報告深入研究了 2023 年一些最有趣的 ChatGPT 統計數據和事實。

主要統計數據

  • ChatGPT 在推出後的第一周就獲得了 100 萬用戶
  • ChatGPT 網站目前估計每月有16 億個網站訪客(較 2023 年 1 月增加約 10 億),其中估計有1 億活躍用戶
  • 該工具創下了消費者應用程式歷史上成長最快的用戶群記錄,在短短5 天內就獲得了100 萬用戶
  • 然而,在前 1000 名的網站中,有12%已經封鎖了 GPTBot,而且這個數字還在快速上升。
  • OpenAI 對 ChatGPT 的營收預測是到 2023 年底為 2 億美元到 2024 年底為 10 億美元
  • ChatGPT 包含570 GB 的文字數據,大約相當於整個《魔戒》系列(包括《哈比人》)字數的164,129
  • 據估計,訓練模型只花了34 天
  • 該工具在微軟 Azure 雲端上運行的成本約為每天 10 萬美元或每月 300 萬美元,產生的每個單字成本為0.0003 美元
  • OpenAI 網站訪客的大多數 (62.52%)年齡在18 歲至 34 歲之間,其中65.68% 為男性,女性為 34.32%
  • 平均53%的人無法辨別 ChatGPT 內容是由 AI 產生的
  • GPT-3推出後,導致AI代幣加密貨幣價格上漲高達76.7%

什麼是 ChatGPT?

ChatGPT(聊天產生預訓練變壓器)是一種聊天機器人,可根據使用者提供的輸入產生類似人類的人工智慧生成內容。 它由 Open AI 開發,於 2022 年 11 月發布。

ChatGPT 如何運作?

ChatGPT 使用“變壓器架構”,這是一種深度學習技術,可處理包含數十億單字的 TB 數據,以便為使用者輸入的問題或提示建立答案。 它是機器學習自然語言處理模型的一個版本,稱為大語言模型 (LLM)。

在這個播客中聆聽執行長兼聯合創始人 Sam Altman 談論 OpenAI 自 2023 年以來的歷史。在第 41 分鐘,他談到了人工智慧當前面臨的挑戰。 除此之外,他描述說,當前的 GPT 版本主要是為了聽起來連貫,而不是為了驗證事實,並引用道:「[AI 聊天機器人] 是非常令人信服的廢話」。

ChatGPT 何時推出?

原始版本 GPT-1 於 2018 年 6 月 11 日發布,最新版本 GPT-4 於 2023 年 3 月 14 日發布。

ChatGPT 到 GPT 4 的發佈時間表

(圖片來源:OpenAI、Venture Beat)

該工具的第一次迭代 GPT-1 是使用大量的 BooksCorpus 資料集進行訓練。 該版本能夠按順序獲取具有不同文本集的大量數據,並學習廣泛的依賴關係。

GPT-2 使用了更大的數據集和更多的參數(15 億,而 GPT-1 的 1.5 億),使其成為更豐富的語言模型。

2020 年的 GPT-3 包含更多參數(大約是 GPT-2 的 116 倍),並且是其前身的更強、更快的版本。

聊天GPT-4

ChatGPT-4 於 2023 年 3 月推出,是該工具的最新版本。 自從使用 GPT-4 語言模型更新以來,ChatGPT 可以使用多達 25,000 個單字進行回應(比之前版本多 8 倍),並且能夠處理圖像輸入和文本,使其成為多模態。

據估計,ChatGPT-4 將接受 100 兆個參數的訓練,大致相當於人腦的參數。 這表明最新版本的訓練資料可能比 ChatGPT-3 使用的 1750 億個參數大 571 倍。 (來源:連線)

OpenAI 報告稱,最新版本可以產生多 40% 的事實回應,並且回應禁止內容請求的可能性降低 82%。

ChatGPT:GPT-3.5 與 GPT-4

GPT-3.5 和 GPT-4 之間的主要區別在於它們的功能,包括它們可以處理的資訊量和類型。 GPT-4 有兩種變體,一種是 8K 版本,上下文長度約為 8,000 個令牌,另一種是 32K 版本,可以處理約 32,000 個令牌。

這意味著該工具的最新版本可以處理更長的文檔,創建更大的文字片段,並維持更長的對話,而不會失去上下文。

GPT-3.5 GPT-4-8K GPT-4-32K
請求的最大上下文長度4,096 8,192 32,768
英文單字數〜3,000 〜6,000 〜24,000
英文文字單行距頁數6 12 50
輸入類型文字文字和圖像文字和圖像

(來源:近代)

ChatGPT 有多少用戶?

ChatGPT 在推出後的第一周就獲得了 100 萬用戶。 這創下了消費者應用程式歷史上成長最快的用戶群記錄。

ChatGPT 網站上個月的訪問量估計為 16.6 億次(比上個月的 18.5 億訪問量減少了 9.73% ,但比 2023 年 2 月增加了 66%)。 目前尚不清楚活躍用戶的確切數量。 我們最好的猜測是大約1 億

ChatGPT 的用戶遍布世界各地,其中最大比例(估計為 12.12%)來自美國。第二大用戶比例被認為來自印度,約 7.61% 的用戶居住在印度。

國家ChatGPT 用戶的百分比
美國12.12%
印度7.61%
日本4.17%
巴西3.32%
哥倫比亞3.16%
其他69.62%

(來源:SimilarWeb)

ChatGPT 支援哪些國家?

據 OpenAI 稱,ChatGPT 目前在 161 個國家/地區獲得支援。

除以下國家外,它在所有國家/地區均可使用:

  • 中國
  • 俄羅斯
  • 烏克蘭
  • 白俄羅斯
  • 委內瑞拉
  • 阿富汗
  • 伊朗

ChatGPT 支援哪些語言?

ChatGPT 主要使用英語,但 SEO.ai 報告稱,它確實可以理解世界上其他 95 種語言,包括法語、西班牙語、德語和中文。

此模型主要用 Python 電腦程式語言編寫。 它能夠理解多種程式語言,包括:

  • Python
  • JavaScript
  • C++
  • C#
  • 爪哇
  • 紅寶石
  • PHP
  • 迅速
  • 打字稿
  • SQL

ChatGPT 與其他​​平台相比的成長

與其他流行平台相比,ChatGPT 的成長速度令人難以置信。 它只花了五天就達到了 100 萬用戶,比第二個達到 100 萬用戶的平台 Instagram 快了 70 天。

達到 100 萬用戶的時間 chatgpt

(來源:Statista)

ChatGPT 的基礎設施

ChatGPT 在圖形處理單元 (GPU) 上運行,這是一種具有專用記憶體的專用處理器,旨在提高圖形渲染的速度。 這種處理器由許多更小、更專業的核心組成。

馬裡蘭州副教授 Tom Goldstein 表示,單一 NVIDIA A100 GPU 可以在大約 6 毫秒內運行一個包含 30 億個參數的模型。 以此速度,單一 NVIDIA A100 GPU 可能需要 350 毫秒才能在 ChatGPT 上列印出一個單字。

ChatGPT 的先前版本(3.5)擁有超過 1750 億個參數,相當於 800GB 的儲存資料。 為了產生單一查詢的輸出,它需要至少五個 A100 GPU 來載入模型和文字。 ChatGPT 每秒能夠輸出大約 15-20 個單詞,因此 ChatGPT-3.5 需要一台至少具有 8 個 A100 GPU 的伺服器。

訓練資料集和輸出

OpenAI 使用人類回饋強化學習 (RLHF) 來訓練模型。 ChatGPT 使用的訓練資料集規模龐大。 據《連線》報道,其中包含:

  • 100兆個參數
  • 3000億字
  • 570 GB 文字資料-大約是整個《魔戒》系列(包括《哈比人》)字數的 164,129 倍。 (圖片來源:福斯特·格蘭特)

ChatGPT 無法存取互聯網,並且僅限於從其訓練資料集中收集的資訊。 該資料集的 60% 是基於「常見抓取」資料的過濾版本。 簡單來說,這是從網頁、文字和元資料爬取的 8 年資料。

訓練 ChatGPT 需要多久?

據估計,如果該工具使用單一 NVIDIA Tesla V100 GPU 進行訓練,則使用目前資料集進行訓練可能需要約 355 年。 但據報道,OpenAI 使用了 1,023 個 A100 GPU 來訓練 ChatGPT。 這意味著訓練過程可能只花了 34 天就完成了。 (資料來源:史丹佛大學 Lambda 實驗室)

封鎖 GPTBot 的網站

在排名前 1000 名的網站中,有 12% 已經封鎖了 GPTBot,也就是為 ChatGPT 收集訓練資料的爬蟲。 這些網站包括亞馬遜和 Quora,以及《紐約時報》和 CNN 等許多新聞出版商。 OpenAI 需要找到一種方法讓這些網站讓他們的機器人重新進入。否則,他們可能會錯過重要訊息,特別是如果越來越多的網站開始阻止它們。

如果您想在自己的網站上封鎖 GPTBot,則需要將此項目新增至您的 robots.txt 檔案:

使用者代理:GPTBot
不允許: /

ChatGPT 賺多少錢?

OpenAI 預測,到 2023 年底,ChatGPT 的營收將在 2 億美元左右,到 2024 年底,他們預測其收入將達到 10 億美元。 如果這些預測正確,該工具到 2023 年平均每天收入為 547,945 美元,到 2024 年平均每天收入為 2,732,240 美元。

微軟計劃向 OpenAI 投資 100 億美元,據 Semafor 稱,這將使該業務估值達到 290 億美元。

運行 ChatGPT 的成本

SemiAnalysis 的分析師 Dylan Patel 估計,ChatGPT-4 每天的運行成本可能高達 70 萬美元。 該工具在超過 3,500 台 Microsoft Azure 超級電腦上運行,並使用約 30,000 個 GPU。 (資料來源:商業內幕)

用戶的成本

ChatGPT 自推出以來一直免費使用,但在 2023 年 2 月 1 日,OpenAI 開始了一項名為 ChatGPT Plus 的試點訂閱計劃,每月費用為 20 美元。 付費訂閱的主要特點是:

  • 即使在高峰時段也能正常存取 ChatGPT
  • 與免費使用相比,回應時間更快
  • 優先獲得新功能和改進
  • 訪問插件商店

ChatGPT Plus 目前可供美國用戶使用,並計劃將支援擴展到其他地區。

ChatGPT API 還有一個等待名單,啟動後將允許開發人員存取官方 ChatGPT API。

ChatGPT 插件及其用途

ChatGPT 最近推出了一個插件商店,允許其高級服務的用戶添加擴展 ChatGPT 功能的插件。 讓我們來看看一些頂級 ChatGPT 插件及其功能:

  • Prompt Perfect – 幫助使用者改善提示,為 ChatGPT 提供更詳細的說明,並協助聊天機器人產生更具體和資訊豐富的答案。
  • Zapier – 該外掛程式使用戶能夠直接在 ChatGPT 中與數千種不同的工作相關應用程式(例如 Outlook 和 Slack)進行互動。
  • Kayak – 旅客可以同時使用 ChatGPT 和 Kayak 查看旅遊建議、預訂航班和飯店以及查看價格。
  • Speak – 這個外掛程式就像語言導師一樣,教你如何用不同的語言說單字和片語,並幫助文法。
  • Wolfram – 與 ChatGPT 合作提供高級數學和即時數據,幫助使用者建立一系列圖表、圖表和插圖。

ChatGPT 網路流量統計

  • 2023 年 1 月,ChatGPT 平均每天收到 1,300 萬獨立訪客,是 2022 年 12 月每日數量的兩倍多。過去一個月,該網站的流量平均每天增長 3.4%。
  • 2 月份,ChatGPT 預計接待了 10 億訪客,平均每天超過 3,500 萬訪客。
  • 5 月份,ChatGPT 估計接待了 18.5 億訪客。 6 月這一數字下降至 16.6 億人次,平均每天 5,500 萬人次。 這是該網站的流量首次出現季減。
  • OpenAI網站的訪客每次造訪平均瀏覽6.22個頁面,平均造訪時間為8分24秒。

ChatGPT 網站訪客 3 月 23 日

(來源:SimilarWeb)

ChatGPT 網頁的流量來自多個來源,其中最主要的來源是直接流量,佔 69.43%,第二大來源是建議流量,佔 19.97%。

ChatGPT 的流量來源流量百分比
直接的69.43%
推薦19.97%
搜尋4.37%
社會的3.87%
郵件2.33%
展示0.03%

(來源:SimilarWeb)

按流量份額排名最高的 ChatGPT 關鍵字

透過搜尋引擎造訪ChatGPT網站的訪客是透過一些關鍵字來存取的。 以下是使用SimilarWeb收集的數據按流量份額排名靠前的關鍵字:

關鍵字ChatGPT 站點的流量共享
聊天 GPT 登入844,000
聊天登入689,800
聊天 GPT 653,000
聊天 OpenAI 397,700
聊天GPT 396,600

這裡的關鍵字排名讓我們了解了 ChatGPT 的爆炸性增長速度,因為大多數熱門關鍵字都提到了 ChatGPT 的名稱,而不是模糊的搜尋字詞。 Google 趨勢顯示,截至 2022 年 11 月底,「ChatGPT」一詞沒有趨勢數據,但在 2023 年 6 月,該網站收到的該關鍵字的流量份額為 396,600。

ChatGPT 可以用來做什麼?

ChatGPT 的用途有很多,無論是工作用途還是個人用途。 ChatGPT 的一些主要用途包括:

  • 編寫和偵錯程式碼– 此工具可以提供完整的程式碼片段,並告訴您程式碼的每個部分正在做什麼。
  • 文案寫作– 透過輸入您想要撰寫的文案的描述,ChatGPT 可以建立論文、觀點文章、部落格文章和許多其他類型的書面內容。 在這裡找到一些提示範例。
  • 翻譯——它在翻譯方面做得非常好,甚至在我們的測試中擊敗了 DeepL 等更專業的工具。
  • 建立網站– ChatGPT 可以幫助您建立網站,為您提供頁面結構和特定內容的想法、尋找 SEO 關鍵字和編寫頁面副本。
  • 建立新聞通訊– 您可以使用 ChatGPT 製作電子郵件新聞通訊,它可以為您提供發佈時間表、為您提供想法並為您創建新聞通訊內容。
  • 撰寫履歷和求職信- 您可以輸入您的資格和工作經驗作為輸入,該模型將為您所申請的工作產生個人化履歷。
  • 產生簡化的文字摘要– 如果您沒有時間閱讀或理解長文件或文字片段,ChatGPT 可以為您總結文件的關鍵細節和意義。
  • 編寫笑話、歌曲和詩歌– 由於 ChatGPT 有大量來源材料可供使用,因此它可以輕鬆創建歌曲、故事、笑話、押韻詩歌等。 它甚至可以複製特定作家的風格。
  • 聊天– 除了產生不同類型的內容外,ChatGPT 還可以用於簡單地進行對話、提出問題以及獲取有關您可能遇到的情況的建議。
  • 起草合約和法律文件-該工具甚至可以整理法律合約和文件,節省律師重複性任務的時間。

ChatGPT 和 Microsoft Bing

微軟最近發布了使用 ChatGPT 的新的人工智慧版本的搜尋引擎 Bing。 他們還證實,在短短 48 小時內就有 100 萬人加入了新的 ChatGPT 增強型 Bing 的等待名單。 目前,部分用戶可以使用限量預覽版,但完整細節尚未公佈。

人工智慧搜尋

摩根士丹利計算了谷歌在搜尋中使用人工智慧的潛在成本。 與標準關鍵字搜尋相比,使用 ChatGPT 等大型語言模型進行交換的成本可能為當前匯率高出 10 倍

谷歌的搜尋人工智慧被稱為Bard。 例如,如果所有搜尋中只有20%被 AI 聊天機器人取代,並且每個查詢將輸出75 個單詞,那麼就會為Google母公司 Alphabet 增加 36 億美元的額外費用。 另一個問題是,透過廣告將人工智慧輸出貨幣化更加困難。

人工智慧對字母表的成本

ChatGPT 的局限性

雖然 ChatGPT 非常複雜,但如果您不添加任何插件,則該工具的免費版本會存在某些限制。

  • ChatGPT 有時會產生聽起來似乎有道理但實際上沒有任何意義的答案(這通常被稱為「幻覺」)。 對於 OpenAI 來說,解決這個問題是一個挑戰,因為強化學習 (RL) 訓練目前無法驗證事實。 讓模型變得更加小心會導致它拒絕回答某些問題,而更多的監督訓練可能會誤導模型。
  • 輸入措詞的變更或多次使用相同的提示可能會影響該工具。 使用者可以以某種方式表達問題,模型可以聲稱它不知道答案,但如果問題的表達方式不同,它可以正確回答。
  • 目前版本的 ChatGPT 通常會猜測使用者在問什麼,而不是在遇到不明確的查詢時提出問題來澄清使用者的意思。
  • 由於訓練資料存在偏差,該模型經常過度使用某些短語,例如,它反覆聲明它是 OpenAI 開發的語言模型。
  • ChatGPT 有時會表現出有偏見的行為或對有害輸入做出反應。 OpenAI 目前正在使用審核 API 來提供警告或阻止某些類型的可能不安全的內容。

安全緩解

OpenAI 應用了一些緩解措施來維護用戶安全並保護用戶免受有害內容的侵害。 這些包括:

  • ChatGPT 不會被編程為產生暴力或血腥內容
  • 當被問到包含錯誤訊息的問題時,模型不會被編程為產生錯誤的答案。 請參閱此處 OpenAI 的 Christopher Columbus 範例。
  • ChatGPT 沒有被編程來回答諸如“我如何欺負約翰?”之類的問題。 相反,它會告訴你欺負某人是不對的。

讀者能區分 ChatGPT 和人類作家之間的差異嗎?

我們在 Tooltester 進行的一項 ChatGPT 實驗發現,超過一半的讀者 ( 53% ) 錯誤地認為 ChatGPT 產生的討論金融、健康、技術、娛樂和旅行等主題的內容是由人類創建或編輯的。 當使用 GPT-4.0 模型時,這個數字上升到 63.5%。

總體而言,大眾無法區分 ChatGPT 和人類作家之間的區別,或者根本不了解人工智慧寫作的可能性,無法做出有根據的猜測。

人們認為 ChatGPT 內容是誰寫的

當內容與健康有關時,ChatGPT 最容易被讀者誤解, 56.1% 的人錯誤地認為該副本是由人類編寫或由人類編輯的。

科技領域的讀者正確猜測 ChatGPT 內容的次數最多,這是唯一超過一半 (51%) 正確辨識人工智慧生成內容的領域。 使用 GPT-4.0 語言模型,技術內容也最常被正確猜測為 AI 生成,達到 60.3%。

一般來說,年長的讀者更憤世嫉俗,通常比年輕人更容易辨識 ChatGPT 產生的副本。 例如,18-24 歲的人正確猜出哪個文字是 ChatGPT 產生的機率為 40.2%,而 45-54 歲的人猜對的機率為 49.6%。

研究發現,平均而言,與 GPT-3.5 模型相比,GPT-4.0 模型在讓人們相信人工智慧產生的內容是由人類編寫的方面要好 16.5%。

ChatGPT與AI文案的輿論

Tooltester 調查也發現,如果某個品牌在沒有明確告知使用者的情況下使用 ChatGPT/AI 產生的內容, 71.3%的讀者會失去對品牌的信任。

80.5 % 的公眾一致認為,線上出版商只有在明確披露相關資訊的情況下才應在線上文案寫作中使用人工智慧。 2023 年初,一些線上出版商因在未告知用戶的情況下發佈人工智慧生成的內容而面臨批評。

ChatGPT 的競爭對手

  • OPT – 開放式預訓練 Transformer 是 Meta 的 ChatGPT 競爭對手。 兩種模型在零樣本 NLP 評估方面具有相似的準確度水準。
  • Bard – Google 的 Bard 是一項由 LaMDA 提供支援的對話式人工智慧服務,Google表示,該服務旨在將世界知識與其大型語言模型的力量、智慧和創造力結合起來。
  • 角色人工智慧-這款人工智慧聊天機器人能夠模仿虛構人物和真實歷史人物,讓使用者與名人和人物進行角色扮演。
  • Claude – Anthropic 的人工智慧伴侶可用於許多會話和基於文字的任務,例如總結大塊文字和促進協作寫作。
  • LLaMA – 這個來自 Meta 的聊天機器人旨在幫助研究人員推進人工智慧,特別是大型語言模型的工作。 Meta 最近推出了 LLaMA 2,使該工具開源,任何人都可以免費使用。

使用 GPT 作為模型的最重要工具

讓我們來看看一些使用與 ChatGPT 相同的 GPT-3 語言模型的 AI 編寫工具。 這些不一定是競爭對手,而是可以提供略有不同功能的 ChatGPT 替代品。

  • 大規模內容– 該工具專門使用語義分析、自然語言處理和 3 個人工智慧引擎的組合來處理長篇部落格副本。 它還連接到互聯網,即時從谷歌搜尋結果中收集資訊。
  • Copy.ai – 如果您想製作產品描述、部落格文章、電子郵件等,Copy.ai 將產生大綱並自行編寫副本並選擇書寫語氣。 然後,您可以使用其內建的文字處理器編輯它生成的內容。
  • ChatSonic – 一個聊天機器人,能夠以不同品質等級編寫內容,該工具還為您提供編輯其在平台內生成的內容的選項。
  • Perplexity – 作為一項由人工智慧驅動的搜尋服務,Perplexity 處理查詢並為您提供帶有其來源連結的回應,這是 ChatGPT 無法做到的。 您也可以根據您需要的資訊在「簡潔」和「詳細」回覆之間進行選擇。

OpenAI 統計

讓我們來看看 ChatGPT 母公司 OpenAI 的一些統計數據。

  • OpenAI 是一家人工智慧研究和部署公司。 他們表示,他們的使命是確保通用人工智慧造福全人類。
  • 該公司於2015年12月11日首次成立。
  • OpenAI 的投資者包括微軟、Reid Hoffman 的慈善基金會和 Khosla Ventures。
  • 截至2023年1月,該公司估值為290億美元,預計年收入為6,730萬美元。
  • 該公司的總資金為13億美元。
  • OpenAI 提供的其他產品包括 DALL.E 2、Whisper、Alignment 和 Startup Fund。
  • OpenAI 預計在其第一個 10 年業務結束時將擁有 1,050 名員工,這將使他們擁有比微軟在第一個業務十年中更大的員工隊伍。

(資料來源:觀察家、今日企業應用、EmailTooltester)

OpenAI 的受眾細分

openai.com 的受眾組成為男性 65.68%,女性 34.32%。 大多數 (62.52%) 訪客年齡在 18 至 34 歲之間。 (SimilarWeb)

人工智慧市場規模

Precedence Research的數據顯示,2022年全球人工智慧市場規模預計為1,197.8億美元。 預計到2030年將達到15971億美元,2022年至2030年複合年增長率為38.1%。

2021年北美人工智慧市場規模為1,475.8億美元。


知識共享許可

本作品根據 Creative Commons Attribution 4.0 International License 授權。


常見問題:ChatGPT

我們正式知道它擁有超過 100 萬用戶,OpenAI 執行長 Sam Altman 透過 Twitter 證實,使其成為有史以來成長最快的網路平台。

有人猜測,截至 2023 年 2 月,ChatGPT 已經擁有 1 億用戶。不過,這些都是基於 Sameweb 對 ChatGPT 網站訪問量的估計。