中國信息通信研究院公布了可信AI代碼大模型評估的首輪評估名單,阿里云通義靈碼、華為云盤古、智譜codegeex等國產(chǎn)AI大模型均入選并首批通過。
此次大模型評估以《智能化軟件工程技術(shù)和應(yīng)用要求第1部分:代碼大模型》標(biāo)準(zhǔn)為依據(jù),圍繞通用能力、專用場景能力、應(yīng)用成熟度,為模型能力提升和企業(yè)選型提供規(guī)范性參考。
此次驗(yàn)證,依據(jù)標(biāo)準(zhǔn)開展,評價(jià)指標(biāo)覆蓋6大通用能力場景、7大專用能力場景、3大服務(wù)成熟度,多維度驗(yàn)證研發(fā)大模型在研發(fā)場景能力和人效優(yōu)化效果方面的場景豐富度,重點(diǎn)考察研發(fā)大模型在代碼理解、代碼生成和補(bǔ)全、研發(fā)問答、單元測試用例生成等方面的能力支持度,全方位評估研發(fā)大模型在數(shù)據(jù)合規(guī)性、模型成熟度、服務(wù)成熟度方面的應(yīng)用成熟度。
目前,華為云盤古大模型、智譜CodeGeeX代碼大模型、阿里云AI編程助手通義靈碼、中國電信(601728)星辰政務(wù)大模型等首批通過評估,并在全部100多個(gè)能力評估中表現(xiàn)優(yōu)秀,獲得4+評級。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。