9月13日消息,科技媒體maginative昨日(9月12日)發(fā)布博文,報道谷歌公司基于谷歌數(shù)據(jù)共享(DataCommons)中的真實世界統(tǒng)計數(shù)據(jù),推出了開放權(quán)重Gemma模型的新版本DataGemma。
語言模型當(dāng)前面臨的一大難題就是幻覺(Hallucinations),尤其是大語言模型(LLMs)在處理數(shù)值或統(tǒng)計數(shù)據(jù)時,這一問題變得尤為棘手,因此精確性至關(guān)重要。
谷歌的DataCommons是一個存儲庫,匯集了來自聯(lián)合國和疾病控制與預(yù)防中心等可信組織收集的超過2400億個數(shù)據(jù)點。
通過利用這一龐大的統(tǒng)計數(shù)據(jù)集,基于Gemini的DataGemma能夠顯著提升模型準(zhǔn)確性,確保其輸出基于真實可信的現(xiàn)實世界信息。
DataGemma方法的核心在于兩種關(guān)鍵技術(shù):檢索交錯生成(RIG)和檢索增強生成(RAG)。這兩種方法通過在生成過程中將模型基于現(xiàn)實世界數(shù)據(jù),從而減少幻覺現(xiàn)象。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。