介紹
開發先進的 AI 技術,尤其是在 **聊天機器人** 領域,吸引了眾多參與者。其中一個例子是 OpenAI 的 **ChatGPT**。當它在 2023 年進入聊天機器人領域時,成為了人們關注的焦點。它由生成式 AI 技術驅動,是用於各種任務的最常用工具之一,從撰寫電子郵件到編寫程式碼無所不包。
2023 年初,另一個性能卓越的聊天機器人問世,那就是由 Google 和 **Anthropic AI**(一家由亞馬遜支援的初創公司)推出的 **Claude**。Claude 2 是第二版,擁有超過 **350,000** 個候補名單註冊使用者,是目前最受歡迎的聊天機器人之一。
快進到 2024 年,Anthropic AI 於 3 月 3 日宣佈推出 Claude 3,這是其最新的 AI 模型家族成員,有望在廣泛的認知問題上樹立新的行業基準。
在本篇文章中,我們將討論有關 Claude 3 的所有內容,包括它如何與 ChatGPT-4 相比以及一些侷限性。
但在我們繼續之前,讓我們先熟悉一下 Anthropic AI 和 Claude 的不同版本。
什麼是 Anthropic AI?
**Anthropic AI** 成立於 2021 年,是一家總部位於加利福尼亞州舊金山的 AI 安全和研究初創公司。該品牌的重點是開發和構建 **LLM**(大型語言模型)和利用這些模型的聊天機器人。**Claude** 就是其中一個聊天機器人,它與 OpenAI 的 **ChatGPT** 競爭。Slack、Quora 和 Notion 等品牌已經認識到 Claude 2 的潛力,並將其整合到其系統中。
Anthropic 採用 **憲法 AI** 方法來開發技術,利用一個框架來確保模型以更安全、誠實和有幫助的方式做出反應。
Anthropic AI 簡史
Anthropic AI 是 Dario 和 Daniela Amodei 的創意,他們分別是 OpenAI 的前研究副總裁和安全與政策副總裁。
最初,Anthropic AI 在 2021 年開始接受融資,從 Jaan Tallin(Skype 的聯合創始人)等投資者那裡籌集了 1.24 億美元。2023 年 5 月,Anthropic AI 收到了科技巨頭 Google 的 **4.5 億美元** 投資。同年 9 月,亞馬遜承諾提供高達 **40 億美元** 的投資,意在讓亞馬遜員工和雲客戶能夠儘早使用 Anthropic AI,而 Anthropic AI 將完全依賴亞馬遜的雲服務,例如為未來模型提供訓練。
什麼是 Claude AI?
**Claude** 是 Anthropic 開發的一款 AI 聊天機器人。它旨在生成基於文字的內容並進行對話,就像我們人類一樣。第一個版本由 LLM Claude 1.3 提供支援,並於 2023 年 3 月釋出。Claude 將其內容寬度從 9,000 個令牌擴充套件到 100,000 個令牌。
此後不久,在 7 月,推出了第二個版本,稱為 **Claude 2**,它比其前身更大、更強大的 LLM。Claude 2 能夠連線到海量資料,從而能夠預測趨勢、比較或對比文件,甚至執行問答。例如,使用者可以上傳技術文件,例如程式碼庫或長篇文學作品。Claude 2 可以處理大約 75,000 個單詞。然後是 **Claude 3**,它設定了新的行業標準,能夠處理 200,000 個單詞,並且比以前版本更有效地減少幻覺。

什麼是 Claude 3?
2024 年 3 月 4 日,Anthropic AI 推出了其 AI 模型家族的新成員——**Claude 3**,它“在各種認知任務上設定了新的行業基準。”
Claude 3 透過公共網頁(包括維基百科文章和書籍)的海量文字資料進行訓練。Anthropic 利用強化學習以及人類反饋來更好地預測其響應序列中下一個最可能的單詞。
**Claude 3** 是一個包含三個 AI 模型的家族,每個模型具有不同的效能能力,使使用者能夠在成本、速度和智慧之間找到適當的平衡。所有模型在內容建立、程式碼生成以及用多種語言進行對話等方面都具有令人印象深刻的能力。
Claude 俳句
**俳句** 被描述為“**輕巧快速**”,是 Claude 家族中最緊湊、最快的模型。它非常適合那些需要速度但也具有成本效益的任務。正如預期的那樣,它是三個可用的 Claude 3 模型中效能最差的模型。
Claude 十四行詩
**十四行詩** 被描述為“**勤奮**”,是三個模型中處於中間水平的模型。在認知問題方面,它提供了強大的效能,並且與 Opus 相比,它的處理時間更短。它的目標是在速度和效能之間取得平衡。它更傾向於為企業任務提供服務,例如資料處理、質量控制和產品推薦。
Claude 樂章
**樂章** 被描述為“**強大**”,是三個模型中效能最強的模型,在針對 AI 系統的許多評估基準測試中,它優於十四行詩和俳句。它在諸如基本數學或研究生水平的專家推理等任務中超越了競爭對手模型。
所有三個模型都經過測試,證明比其前身 **更快**、**更智慧**。根據 Anthropic 的說法,“樂章和十四行詩現在可以在 claude.ai 和 Claude API 中使用,Claude API 現在已在 159 個國家/地區普遍可用。俳句將很快推出。”

Claude 3 在其同行中處於什麼地位?
**Claude 樂章** 模型在大多數常見的評估基準測試(如數學、推理和測試專家知識)中超越了其他 AI 系統。它還展示了類似人類的複雜問題理解能力和流暢性。使 Claude 不同於其他模型的一個關鍵特徵是它採用了 **憲法 AI**,而其他模型只關注效能。3 個 Claude 模型旨在監控風險並分析道德考量。與 GPT-3.5、GPT-4、Gemini Ultra 或 Gemini Pro 等其他模型相比,Claude 3 模型在各種任務和問題(如程式碼生成、內容建立,甚至法語、西班牙語和日語等非英語語言的熟練程度)方面都擁有令人印象深刻的能力。
Claude 模型不僅支援多種語言,還擁有視覺功能。由於它們是在各種視覺資料上訓練的,因此這些模型可以有效地分析和推斷各種視覺內容的資訊。例如,它可以解釋視覺資料,如 AI2D 科學圖表中所示,並在零樣本和少樣本設定中實現高準確率。

Anthropic 提供的 Claude 3 多模態視覺功能基準測試圖表
現在,讓我們看看更大的圖景!
Claude 3 與 ChatGPT-4 的比較
準確地說,Claude 3 或 Claude 樂章以及 GPT-4 在 10 個 AI 基準測試(如 HumanEval(編碼)、MMLU(本科水平知識)和 GSM8K(小學數學))中執行。如表所示,Claude 3 險勝競爭對手,包括 GPT-4。例如,樂章在 GSM8K 中比 GPT-4 高出 3%,在 HumanEval 中高出 17.9%。數字本身說明了一切,Claude 在所有 10 個基準測試中都超越了 GPT-4。

10 個 AI 基準測試
另一個需要注意的方面是詞數。如前所述,Claude 3 可以處理多達 200,000 個單詞,而 GPT-4 的限制是 64,000 個單詞。這意味著 Claude 擁有更大的“上下文視窗”,它可以在其中記住更多的對話並生成更長的文字。對於處理大量資料集和文件的企業任務來說,這是一個巨大的優勢。
GPT-4 等聊天機器人面臨的另一個問題是隱私問題。大多數 GPT 使用者都知道,使用者與機器人進行的對話會被儲存下來,用於訓練模型以產生更準確的結果。但這一點令人擔憂,尤其是在處理敏感資訊時。相反,Claude 不使用對話來訓練模型,並在後臺 90 天內刪除提示和輸出。
Claude 3 的侷限性
根據早期訪問使用者的反饋,Claude 3 在指導性任務或回答事實問題方面表現出色。但它有時難以應對數學和複雜推理問題。也存在偏差的響應情況。
Claude 3 目前也是市場上最昂貴的模型,但目前正在討論在不久的將來提供更實惠的方案。
結論
Anthropic AI 的研究人員旨在使生成式 AI 更穩定、更有用。藉助憲法 AI 的力量,他們不僅打算改進響應,而且還希望使其更易於使用者理解。就像人類能夠理解正確的響應一樣,Claude 3 有望模擬人類的響應。
自己去試試吧!訪問 www.claude.ai,免費開始您的對話!每天的提示次數有限,因此如果您希望使用更多提示,可以選擇 Claude Pro 計劃,每月 20 美元。
敬請關注更多精彩內容。我們下一篇文章見!






