“Meta推出開源大語言模型Llama 3,性能超越GPT-3.5”

/
/
“Meta推出開源大語言模型Llama 3,性能超越GPT-3.5”
Llama 3 Vs Gpt 3 5 Comparison

“Meta大展開放原始碼策略,開創新紀元的大型語言模型Llama 3”

科技巨頭Meta推出Llama 3,這是其最新一代開源大型語言模型(LLM)。該公司稱Llama 3建立了新的性能基準,超越了實際應用中先前的行業領先模型如GPT-3.5。

在一個博客文章中,Meta公告其發佈,”我們的目的在於創建與當今最佳專有模型相當的最重要的開放模型。”

首批開放的Llama 3模型有80億個和700億個參數版本。Meta表示,其團隊還在訓練大於4000億參數的大型模型,並將在接下來的幾個月中與詳細研究工作的論文一起釋出。

Meta的新一代模型被稱為Llama 3,是一個開源的大型語言模型,被認為是目前開源領域中的最新進展。該公司聲稱,Llama 3為性能基準樹立了新的高度,超越了先前公認為業界領先的GPT-3.5等模型。這種創新的模型開發將對現實世界的應用產生重大影響。

Meta在公佈這一開源模型時表示,他們的目標是創建出可以與如今最佳專有模型媲美的開源模型。這種意識在當前的科技環境中顯得尤為重要,開源與共享變得越來越重要,這正是這種創新模型引人注目之處。

首批開放的Llama 3模型包括80億個和700億個參數的版本。進一步的,Meta的團隊正在開發擁有超過4000億參數的大型模型,並計劃在未來幾個月釋出這些模型和詳細的研究論文。

在創建Llama 3模型的過程中,Meta即投入了巨大的資源並且優化了模型結構,這也體現在他們的開源策略上,極力追求開放和透明。他們的70億參數模型在12個主要的應用場景如編程,推理,創意寫作等方面,超越了GPT-3.5,Claude和其他同等規模的LLM模型。該公司的8億參數模型也在多項知名的LLM任務中設立了新的基準。

以我的專業角度來看,Llama 3無疑將為AI發展提供了一片開放的生態系統,以進一步推動AI的發展。該模型將在所有主要的雲服務提供商,硬體製造商和AI平臺上可用,有助於實現AI的廣泛集成和應用。

至於安全性,Meta也升級了他們的AI安全工具,以分類風險和評估潛在的濫用情況。同時,他們還有個名為Code Shield的新組件,用於過濾在推斷時的不安全的代碼建議。

總之,Llama 3模型的推出,可視為Meta致力於提倡開源,並進一步推動人工智能的透明度,以應對日益嚴格的AI規則的重要舉動,而該動向對於大規模利用AI技術的未來秩序將產生廣深的影響。
Meta已經推出了Llama 3,這是它頂尖的開放源碼大語言模型(LLM)的下一代版本。這家科技巨頭宣稱,Llama 3設定了新的性能基準,超越了像GPT-3.5這樣的前行業領先模型在實際情境中的表現。

Meta在發布公告的部落格文章中表示:“我們致力於建設最好的開源模型,使其能與當今最好的專有模型相比。”

首批開放的Llama 3模型是80億和700億參數的版本。Meta表示,它的團隊仍在訓練更大的4000億+參數的模型,這些模型將在接下來的幾個月內發布,同時將發布詳細介紹這項工作的研究論文。

Llama 3的製作已經歷過兩年多的時間,並且投入了大量資源來收集高品質的訓練數據,擴大分佈訓練,優化模型架構,並採用創新的方法進行精細調整。

Meta的700億參數精細調校後模型在12個關鍵使用情境(如編碼、推理和創意寫作)的人群評估中超越了GPT-3.5、Claude和其他相同規模的LLM。該公司的80億參數預訓練模型也在人氣LLM評估任務上設立了新的基準。

“我們相信,這些是目前最好的開源模型,”Meta指出。

科技巨頭透過“預設開放”方式推出這些模型,以推動AI開發的開放生態系統。所有主要的雲服務供應商、模型主機、硬體製造商和AI平台都可以使用Llama 3。

請閱讀:SAS致力於通過打包AI模型,使AI無論技能如何都可以訪問

希望從業界領袖那裡進一步了解AI和大數據嗎?請查看在阿姆斯特丹、加利福尼亞和倫敦舉行的AI & Big Data Expo。這次全面的活動將與其他領先的活動一起舉辦,包括BlockX數位轉型週,以及網路安全和雲端博覽會

點擊這裡探索由TechForge推動的其他即將舉行的企業技術活動和網路研討會。

原文載於AI新聞

Meta raises the bar with open source Llama 3 LLM

(引文來源:完整新聞連結