近期,谷尼國際軟件在網(wǎng)絡(luò)輿論情報智能評價技術(shù)領(lǐng)域取得重大突破,使互聯(lián)網(wǎng)輿情中涉及的公共安全事件或企業(yè)危機(jī)可以得到及時的預(yù)警提示。在現(xiàn)實(shí)危機(jī)發(fā)生之前,基于以往總結(jié)的知識或監(jiān)測得到的可能性前兆,由軟件提前做出初步的預(yù)警信號,報告危機(jī)程度,以便決策者早作準(zhǔn)備,預(yù)防危機(jī)發(fā)生或者在準(zhǔn)備不足的情況下發(fā)生,從而最大程度地降低損失。
據(jù)谷尼國際軟件副總裁鄒鴻強(qiáng)介紹,谷尼網(wǎng)絡(luò)輿情智能分析評價平臺是基于新一代文本挖掘技術(shù)的設(shè)計,利用中文信息處理技術(shù),對信息自動進(jìn)行聚類、情感分析、提取摘要等,并進(jìn)一步生成詳盡的輿情分析報告,為各級政府和企業(yè)的網(wǎng)絡(luò)輿情或?qū)n}研究提供傳播趨勢、演變規(guī)律的分析圖表輿情報告。
他指出,該網(wǎng)絡(luò)輿情智能評價技術(shù)主要有以下四大特點(diǎn):第一,人工智能。自帶情感分析,自動根據(jù)文章內(nèi)容判斷其情感傾向與危機(jī)度,區(qū)分正負(fù)面,為分析及決策者提供重要參考。第二, 覆蓋面廣。覆蓋所有中文搜索引擎,包含國內(nèi)主流的上百萬個新聞網(wǎng)站、論壇、博客、貼吧等。第三,準(zhǔn)確率高。內(nèi)容的抽取準(zhǔn)確率達(dá)98%,正負(fù)面判斷準(zhǔn)確率在90%以上。第四,自動生成分析報告。通過語義分析與數(shù)據(jù)挖掘處理,自動處理和統(tǒng)計分析當(dāng)前的監(jiān)測主題,1分鐘直接輸出各種規(guī)范格式的輿情分析報告,包含概述、圖表、數(shù)據(jù)、排行等。
我們推出文本傾向性分析核心技術(shù)組件Goonie Sentiment Metrics,就是對用戶對某個事物的看法或評論的文本進(jìn)行挖掘評價,從而得到該看法或評論是屬于對該事物的積極或消極意見。谷尼國際軟件鄒鴻強(qiáng)說。
傳統(tǒng)的人工文本分類技術(shù),先對待分析文本中的形容詞或能夠體現(xiàn)主觀色彩的短語進(jìn)行抽取,然后對抽取出來的形容詞或短語逐一進(jìn)行傾向性判斷并賦予一個傾向值,最后將上述所有傾向值累加起來,得到文章的總體文本的傾向性。而谷尼國際軟件則是在此基礎(chǔ)上研發(fā)了基于機(jī)器學(xué)習(xí)的文本傾向性分析技術(shù),即先通過人工標(biāo)注一些海量語料文件傾向性,并將這些文檔作為訓(xùn)練集,再通過機(jī)器學(xué)習(xí)的方法構(gòu)造一個文本情感分類器,最后使用構(gòu)造好的情感分類器對文檔進(jìn)行分類,即識別出該文檔的傾向性。谷尼國際軟件副總裁鄒鴻強(qiáng)說。
他表示,谷尼國際軟件公司自2004年起致力于定向搜索與網(wǎng)絡(luò)監(jiān)測技術(shù)開發(fā)和研究,有著深厚的技術(shù)實(shí)力,擁有自主知識產(chǎn)權(quán)的中英文分詞組件、文本挖掘組件、情感分析組件等核心技術(shù)組件。能夠在網(wǎng)絡(luò)輿情智能評價技術(shù)領(lǐng)域取得重大突破,一方面依賴于多年的文本處理核心技術(shù)經(jīng)驗(yàn);另一方面,源于整合利用輿情分析海量專業(yè)知識庫,計算機(jī)應(yīng)用人的智慧從而大大提高了內(nèi)容的分析評價準(zhǔn)確率。
由于我們的語料庫是以公共事件和企業(yè)危機(jī)為主,通過谷尼網(wǎng)絡(luò)輿情智能分析評價系統(tǒng)可以對公共安全事件或關(guān)于企業(yè)的負(fù)面信息進(jìn)行基于軟件的預(yù)警分析,但是在部分專業(yè)性比較強(qiáng)的領(lǐng)域,如化工、冶金、材料等領(lǐng)域,準(zhǔn)確率還有待提高。鄒鴻強(qiáng)也坦承,網(wǎng)絡(luò)輿情智能分析評價平臺中應(yīng)用的文本傾向性分析技術(shù)仍有進(jìn)一步提升和完善的空間。