近日消息,OpenAI在10月1日舉辦的DevDay活動日中,宣布推出了Whisperlarge-v3-turbo語音轉(zhuǎn)錄模型,共有8.09億參數(shù),在質(zhì)量幾乎沒有下降的情況下,速度比large-v3快8倍。
Whisperlarge-v3-turbo語音轉(zhuǎn)錄模型是large-v3的優(yōu)化版本,并且只有4層解碼器層(DecoderLayers),作為對比large-v3共有32層。
Whisperlarge-v3-turbo語音轉(zhuǎn)錄模型共有8.09億參數(shù),比7.69億參數(shù)的medium模型稍大,不過比15.5億參數(shù)的large模型小很多。
OpenAI表示W(wǎng)hisperlarge-v3-turbo的速度比large模型快8倍,并且所需的VRAM為6GB,而large模型需要10GB。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。