近日,中國(guó)電信人工智能研究院發(fā)布業(yè)內(nèi)首個(gè)支持30種方言自由混說(shuō)的語(yǔ)音識(shí)別大模型——星辰超多方言語(yǔ)音識(shí)別大模型,打破單一模型只能識(shí)別特定單一方言的困境,可同時(shí)識(shí)別理解粵語(yǔ)、上海話、四川話、溫州話等30多種方言,是國(guó)內(nèi)支持最多方言的語(yǔ)音識(shí)別大模型。據(jù)悉,該大模型研發(fā)團(tuán)隊(duì)首創(chuàng)“蒸餾+膨脹”聯(lián)合訓(xùn)練算法,解決超大規(guī)模多場(chǎng)景數(shù)據(jù)集和大規(guī)模參數(shù)條件下,預(yù)訓(xùn)練坍縮的問(wèn)題,實(shí)現(xiàn)1B參數(shù)80層模型穩(wěn)定訓(xùn)練。星辰語(yǔ)音大模型也是業(yè)內(nèi)首個(gè)開源的基于離散語(yǔ)音表征的語(yǔ)音識(shí)別大模型,通過(guò)“從語(yǔ)音到token再到文本”的建模新范式,將推理時(shí)語(yǔ)音傳輸比特率降低數(shù)十倍。目前,星辰語(yǔ)音大模型已在福建、江西、廣西、北京、內(nèi)蒙等地的中國(guó)電信萬(wàn)號(hào)智能客服試點(diǎn)應(yīng)用。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。