7月19日消息,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛17日宣布,商湯絕影在行業(yè)內(nèi)率先實(shí)現(xiàn)了原生多模態(tài)大模型的車(chē)端部署。車(chē)載端側(cè)8B模型首包延遲在300毫秒以?xún)?nèi),推理速度40Tokens/秒,覆蓋主流算力平臺(tái)。
商湯絕影為多模態(tài)大模型打造計(jì)算引擎“HyperPPL”,目前擴(kuò)展并支持主流車(chē)載計(jì)算硬件,兼容多種主流操作系統(tǒng),適配多個(gè)車(chē)載芯片的部署平臺(tái)。
商湯絕影稱(chēng)HyperPPL針對(duì)車(chē)載多人場(chǎng)景進(jìn)行優(yōu)化,使得車(chē)內(nèi)多人并發(fā)情況下,車(chē)端多模態(tài)大模型的模型推理效率相比單人沒(méi)有明顯降低。
商湯絕影此前表示,深圳首條自動(dòng)駕駛公交線路采用其車(chē)輛與技術(shù),所有駕駛操作都無(wú)需人員介入。
明年上千TOPS算力的車(chē)載芯片(英偉達(dá)Thor)就會(huì)問(wèn)世?;诟咚懔Φ挠?jì)算平臺(tái),商湯預(yù)計(jì)絕影多模態(tài)大模型車(chē)端部署方案的首包延遲將大幅降低,推理速度進(jìn)一步提高。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。