10月27日消息,OpenAI本周公布了一款名為sCM的新型AI文生圖方案。
與傳統(tǒng)的擴(kuò)散模型相比,sCM僅需兩個(gè)步驟即可生成高質(zhì)量樣本,號(hào)稱能夠?qū)⑽纳鷪D效率提升約50倍,且生成的樣本質(zhì)量能與“業(yè)界較強(qiáng)的擴(kuò)散模型”相比較,為AI文生圖提供了新的方案。
目前業(yè)界通常使用擴(kuò)散模型生成圖片及音視頻,但傳統(tǒng)擴(kuò)散模型的取樣過程通常緩慢,通常需要數(shù)十到數(shù)百個(gè)逐步降噪的過程才能生成高質(zhì)量樣本(例如小伙伴們使用SD“煉丹”繪圖就需要等待特別長(zhǎng)的降噪時(shí)間),這使得相應(yīng)模型效率低下,不適合商業(yè)化應(yīng)用。
雖然目前業(yè)界已出現(xiàn)一些技術(shù)以加快擴(kuò)散模型的速度,但無非只是利用復(fù)雜訓(xùn)練過程“提純”模型,或通過降低輸出樣本質(zhì)量下降以提升效率。
而OpenAI研究團(tuán)隊(duì)則提出了一種名為sCM的文生圖方案,這一生成模型方法繞開了傳統(tǒng)擴(kuò)散模型范疇,號(hào)稱僅需兩個(gè)取樣步驟即可生成與擴(kuò)散模型質(zhì)量相當(dāng)?shù)母叻直媛蕵颖?,極大縮短了生成時(shí)間。
sCM訓(xùn)練方法主要利用預(yù)訓(xùn)練擴(kuò)散模型蒸餾出來的知識(shí)直接打造模型,號(hào)稱能夠在縮短取樣時(shí)間的同時(shí)保持高質(zhì)量樣本生成。
研究人員使用ImageNet512x512數(shù)據(jù)集,利用sCM方法訓(xùn)練模型,號(hào)稱能夠生成細(xì)節(jié)豐富且高質(zhì)量的圖像,展示其在高分辨率生成方面的能力。盡管sCM只有兩個(gè)取樣步驟,生成樣本的質(zhì)量仍接近業(yè)界“最佳的擴(kuò)散模型”,號(hào)稱“差異不到10%”。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。