以文生圖模型Stable Diffusion聞名的人工智慧公司Stability AI,現在要進軍程式碼開發市場,釋出該公司第一個用於程式開發的大型語言模型StableCode,該模型除了可以協助開發者完成日常工作,同時也能幫助開發者學習程式開發。

StableCode模型的訓練總共分為三個階段,最初Stability AI使用來自BigCode專案的stack-dataset v1.2資料集,對基礎模型進行多語言訓練,接著針對熱門程式語言,諸如Python、Go、Java、Javascript、C、markdown和C++進行特化訓練,總共使用了5,600億個Token訓練模型。基礎模型建立完成後,官方進一步針對特定用途調校指令模型,以解決複雜的程式開發任務,在基礎模型上訓練了約12萬個Alpaca格式的程式碼指令和回應資料對。

StableCode模型的特色在於,能夠理解和處理長篇幅上下文,也就是模型在做決策時,能夠更廣泛地考慮前後相鄰的資料,也就是具有一次處理更多程式碼Token的能力,進而提供更精確有用的建議,官方提到,StableCode一次可以處理的程式碼Token數量,約是32,000到64,000間,用戶能夠一次處理的檔案量,約是5份一般大小的Python檔案。

Stability AI將StableCode與其他類似大小的模型相比,在HumanEval基準pass@1,模型回傳的第一個答案正確性,StableCode勝過replit-coder,但是略輸BigCode的Starcoder,而比較pass@10,也就是模型所生成的前10個答案中,是否包含正確答案的指標,StableCode則是勝過Starcoder和replit-coder。

熱門新聞

Advertisement