聯(lián)手微軟掀全球AI狂歡Meta推出免費(fèi)商用的Llama 2,最強(qiáng)“GPT-4平替”開源!
今天,F(xiàn)acebook母公司Meta發(fā)布其首個開源可商用大語言模型Llama 2!
智東西7月19日報道,今天凌晨,Meta在其官網(wǎng)宣布大語言模型Llama 2正式發(fā)布,Llama 2是Meta大語言模型Llama模型的最新版本,也是Meta首個免費(fèi)商用的大語言模型。
該模型目前支持70億、130億、700億等多個參數(shù)規(guī)模版本。相較Llama 1,Llama 2經(jīng)過2萬億個tokens訓(xùn)練,其對上下文訓(xùn)練的長度是Llama 1的兩倍,達(dá)到4096。Llama-2-chat模型還接受了超過100萬個人工標(biāo)注訓(xùn)練。由于其強(qiáng)大的參數(shù)規(guī)模以及性能表現(xiàn),不少人稱之為“GPT-4最強(qiáng)平替”,也是大模型之戰(zhàn)中AI平權(quán)的又一例證。
此外,Meta和微軟高調(diào)宣布將在生成式AI領(lǐng)域聯(lián)手,微軟將成為Llama 2的首選合作伙伴。微軟Azure客戶將能夠在Azure上輕松安全地微調(diào)和部署Llama 2模型,快速構(gòu)建適用于自身業(yè)務(wù)的專用大模型。
“大語言模型正被企業(yè)用作生成式AI的核心要素。”Meta在官網(wǎng)中說道。Llama 2模型的發(fā)布,是Meta在大語言模型領(lǐng)域的又一次有力發(fā)聲。此前,谷歌、微軟曾通過接入大語言模型,更新其旗下多個產(chǎn)品線。
OpenAI的GPT-4和Meta的Llama分別是大語言模型領(lǐng)域閉源和開源的代表。全球有眾多大模型基于Llama開發(fā)而來,但又受限于無法免費(fèi)商用。隨著Llama2免費(fèi)開源商用,并與微軟這樣的云服務(wù)商深度合作,開源力量可能重新劃分AI市場的格局,對眾多大模型應(yīng)用企業(yè)也是好消息。
現(xiàn)在,用戶需要通過提交表格的方式即可獲得Llama-2-chat模型。用戶下載每個模型后,將收到大模型的型號代碼、規(guī)模、用戶指南信息。
論文地址:
https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
項目地址:
https://github.com/facebookresearch/llama
Llama-2-chat模型下載地址:
https://ai.meta.com/resources/models-and-libraries/llama-downloads/
一、Llama-2大模型,強(qiáng)在哪里?
Llama 2是一組經(jīng)過預(yù)先訓(xùn)練和精細(xì)調(diào)整的大型語言模型(LLMS),規(guī)模從70億到700億參數(shù)不等。
目前,Meta正式發(fā)布了Llama 2大模型的70億、130億、 700億三個參數(shù)規(guī)模版本。據(jù)悉,Meta還訓(xùn)練了340億版本,但沒有發(fā)布。在論文中,我們還發(fā)現(xiàn)了330億和650億版本的Llama 2訓(xùn)練數(shù)據(jù)信息。
此次發(fā)布過程中,Meta還隨著Llama-2大模型提供預(yù)訓(xùn)練模型和對話微調(diào)版本的模型權(quán)重和初始代碼。
在此次訓(xùn)練中,Meta還將預(yù)訓(xùn)練語料庫的規(guī)模增加了40%,將模型的上下文長度增加了一倍,并采用了分組查詢注意力(grouped-query attention)方法。
根據(jù)Meta公布的測評數(shù)據(jù),Llama 2在許多外部基準(zhǔn)測試上都優(yōu)于其他開源語言模型,包括推理、編碼、熟練程度和知識測試。基于人類對大模型的有用性以及安全的評估,Llama 2可能是封閉源模型如GPT等的適當(dāng)替代品。
其中,Llama 2-Chat是針對對話AI場景進(jìn)行優(yōu)化的,使用來自人類反饋的強(qiáng)化學(xué)習(xí)來確保安全性和有用性。
在訓(xùn)練過程中,Llama 2使用公開的在線數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。然后通過使用監(jiān)督微調(diào)創(chuàng)建Llama-2-chat的初始版本。接下來,Llama-2-chat會通過人類反饋強(qiáng)化學(xué)習(xí)第一次出現(xiàn)標(biāo)注上(RLHF)進(jìn)行迭代細(xì)化,其中包括拒絕采樣和近端策略優(yōu)化(PPO)。
Llama-2大模型將免費(fèi)用于研究和商業(yè)用途。微軟是Llama 2的首選合作伙伴。據(jù)悉,Llama 2可在 Azure AI模型目錄中使用,使用Microsoft Azure的開發(fā)人員能夠使用它進(jìn)行構(gòu)建,并利用其云原生工具進(jìn)行內(nèi)容過濾和安全功能。
Llama 2還針對在Windows的本地運(yùn)行進(jìn)行了優(yōu)化,為開發(fā)人員提供了無縫工作流程,為跨不同平臺的客戶帶來生成式AI體驗。目前,Llama2也可通過Amazon Web Services(AWS)、Hugging Face和其他提供商獲取。
二、經(jīng)過三方安全測試,Meta與微軟聯(lián)合推動Llama-2落地
人工智能在給社會帶來巨大進(jìn)步的同時,也伴隨著風(fēng)險。Meta希望提供開源,以促進(jìn)大模型的透明度。
據(jù)Meta介紹,Llama-2已經(jīng)通過安全測試。測試團(tuán)隊不但來自于Meta內(nèi)部,通過生成對抗性提示以促進(jìn)模型微調(diào),還有第三方機(jī)構(gòu)對Llama-2進(jìn)行外部對抗性測試,以識別性能差距。
在Meta進(jìn)一步的研究論文里,Meta解釋了模型的微調(diào)和評估方法并指出了其缺點,并披露了此前經(jīng)歷過的已知挑戰(zhàn)和問題。
Meta創(chuàng)建了大模型指南作為指引,以支持開發(fā)人員提供負(fù)責(zé)任的開發(fā)和安全評估的最佳實踐。該指南概述了一些實踐成果,反映了整個人工智能研究行業(yè)討論有關(guān)負(fù)責(zé)任的生成式AI最先進(jìn)的研究。
Meta還啟動了一項新的合作伙伴計劃,研究人員可以申請加入從業(yè)者社區(qū),分享有關(guān)Llama-2的經(jīng)驗,社區(qū)將制定一個研究議程來推動未來的發(fā)展。同時,Meta還在政策監(jiān)管下,明確禁止某些使用大語言模型的指導(dǎo)方向,以幫助確保這些模型得到公平和負(fù)責(zé)任的使用。
結(jié)語:開源大模型,Meta加速AI領(lǐng)域發(fā)展
隨著Meta大模型Llama 2發(fā)布,全球的大語言模型矩陣又新增一位重磅嘉賓。Meta和微軟的聯(lián)合,也迅速將Llama 2的應(yīng)用,直接和成千上萬的開發(fā)者連接起來。
相較于上一代,Llama 2 在推理、編碼、熟練程度和知識測試,優(yōu)于其他開源語言模型。
隨著大模型研發(fā)和落地的加速狂飆,我們有望看到更多大模型為生活以及產(chǎn)業(yè)帶來巨大影響。
來源: 智東西