“Meta推出開源大語言模型Llama 3，性能超越GPT-3.5”

首頁

技術進展

AI Daily 編輯群
發布： 2024-05-02
更新：2024-05-02

Facebook Messenger Line Threads Copy

“Meta大展開放原始碼策略，開創新紀元的大型語言模型Llama 3”

科技巨頭Meta推出Llama 3，這是其最新一代開源大型語言模型(LLM)。該公司稱Llama 3建立了新的性能基準，超越了實際應用中先前的行業領先模型如GPT-3.5。

在一個博客文章中，Meta公告其發佈，”我們的目的在於創建與當今最佳專有模型相當的最重要的開放模型。”

首批開放的Llama 3模型有80億個和700億個參數版本。Meta表示，其團隊還在訓練大於4000億參數的大型模型，並將在接下來的幾個月中與詳細研究工作的論文一起釋出。

Meta的新一代模型被稱為Llama 3，是一個開源的大型語言模型，被認為是目前開源領域中的最新進展。該公司聲稱，Llama 3為性能基準樹立了新的高度，超越了先前公認為業界領先的GPT-3.5等模型。這種創新的模型開發將對現實世界的應用產生重大影響。

Meta在公佈這一開源模型時表示，他們的目標是創建出可以與如今最佳專有模型媲美的開源模型。這種意識在當前的科技環境中顯得尤為重要，開源與共享變得越來越重要，這正是這種創新模型引人注目之處。

首批開放的Llama 3模型包括80億個和700億個參數的版本。進一步的，Meta的團隊正在開發擁有超過4000億參數的大型模型，並計劃在未來幾個月釋出這些模型和詳細的研究論文。

在創建Llama 3模型的過程中，Meta即投入了巨大的資源並且優化了模型結構，這也體現在他們的開源策略上，極力追求開放和透明。他們的70億參數模型在12個主要的應用場景如編程，推理，創意寫作等方面，超越了GPT-3.5，Claude和其他同等規模的LLM模型。該公司的8億參數模型也在多項知名的LLM任務中設立了新的基準。

以我的專業角度來看，Llama 3無疑將為AI發展提供了一片開放的生態系統，以進一步推動AI的發展。該模型將在所有主要的雲服務提供商，硬體製造商和AI平臺上可用，有助於實現AI的廣泛集成和應用。

至於安全性，Meta也升級了他們的AI安全工具，以分類風險和評估潛在的濫用情況。同時，他們還有個名為Code Shield的新組件，用於過濾在推斷時的不安全的代碼建議。

總之，Llama 3模型的推出，可視為Meta致力於提倡開源，並進一步推動人工智能的透明度，以應對日益嚴格的AI規則的重要舉動，而該動向對於大規模利用AI技術的未來秩序將產生廣深的影響。
Meta已經推出了Llama 3，這是它頂尖的開放源碼大語言模型（LLM）的下一代版本。這家科技巨頭宣稱，Llama 3設定了新的性能基準，超越了像GPT-3.5這樣的前行業領先模型在實際情境中的表現。

Meta在發布公告的部落格文章中表示：“我們致力於建設最好的開源模型，使其能與當今最好的專有模型相比。”

首批開放的Llama 3模型是80億和700億參數的版本。Meta表示，它的團隊仍在訓練更大的4000億+參數的模型，這些模型將在接下來的幾個月內發布，同時將發布詳細介紹這項工作的研究論文。

Llama 3的製作已經歷過兩年多的時間，並且投入了大量資源來收集高品質的訓練數據，擴大分佈訓練，優化模型架構，並採用創新的方法進行精細調整。

Meta的700億參數精細調校後模型在12個關鍵使用情境（如編碼、推理和創意寫作）的人群評估中超越了GPT-3.5、Claude和其他相同規模的LLM。該公司的80億參數預訓練模型也在人氣LLM評估任務上設立了新的基準。

“我們相信，這些是目前最好的開源模型，”Meta指出。

科技巨頭透過“預設開放”方式推出這些模型，以推動AI開發的開放生態系統。所有主要的雲服務供應商、模型主機、硬體製造商和AI平台都可以使用Llama 3。

請閱讀：SAS致力於通過打包AI模型，使AI無論技能如何都可以訪問

希望從業界領袖那裡進一步了解AI和大數據嗎？請查看在阿姆斯特丹、加利福尼亞和倫敦舉行的AI & Big Data Expo。這次全面的活動將與其他領先的活動一起舉辦，包括BlockX，數位轉型週，以及網路安全和雲端博覽會。

點擊這裡探索由TechForge推動的其他即將舉行的企業技術活動和網路研討會。

原文載於AI新聞。