記者:尊敬的各位ENI會員大家好,歡迎收看本期的零距離。今天做客ENI訪談的是明略數(shù)據(jù)的技術(shù)副總裁黃總,接下來有請他來給我們打個(gè)招呼。
黃代恒:大家好,我是黃代恒。很高興和大家一起聊大數(shù)據(jù)和人工智能的話題。
記者:打開明略的網(wǎng)站,有一句話令人印象深刻,“明略是國內(nèi)最專業(yè)的大數(shù)據(jù)的整體解決方案提供商。”您能解釋一下這句話背后所覆蓋的能力嗎?
黃代恒:這句話本身比較大,我們可以從人才、產(chǎn)品、所服務(wù)得行業(yè)三個(gè)方面來談一下明略的服務(wù)內(nèi)容。明略是14年中旬初創(chuàng)的創(chuàng)新公司,核心技術(shù)團(tuán)隊(duì)來自于大數(shù)據(jù)分析互聯(lián)網(wǎng)廣告公司---秒針。而明略當(dāng)初成立出來最大的情懷是把大數(shù)據(jù)的技術(shù)能力用于最關(guān)乎國計(jì)民生的領(lǐng)域,像公安、金融、高端工業(yè)制造等。所以,明略最寶貴的財(cái)富是技術(shù)人員,公司大概有30個(gè)左右的技術(shù)合伙人,并且都在大數(shù)據(jù)和核心技術(shù)架構(gòu)領(lǐng)域有非常深的研究,完全可以勝任其他公司技術(shù)總監(jiān)的職位。
除了人才,明略另一個(gè)積累是把知識落地成產(chǎn)品。目前主推三大產(chǎn)品線:MDP(安全、高效可用的數(shù)據(jù)資產(chǎn)管理平臺)、DataInsight(知識構(gòu)建與管理平臺)和SCOPA(大數(shù)據(jù)圖譜聯(lián)機(jī)分析產(chǎn)品)?;谶@三個(gè)平臺之上,我們組合了非常多的解決方案來幫助很多的標(biāo)桿客戶來進(jìn)行落地。對于大數(shù)據(jù)技術(shù),之前大家往往是說得多,落地的少,真正能夠?yàn)槠髽I(yè)級客戶提供大數(shù)據(jù)解決方案的公司并不多。明略的重點(diǎn)客戶包括銀聯(lián)商務(wù)等金融領(lǐng)域客戶,在公安領(lǐng)域明略去年共實(shí)施一個(gè)省七個(gè)地市一個(gè)縣,今年至少落地大概二十個(gè)地市來進(jìn)行情報(bào)分析、數(shù)據(jù)加工,極大程度的提升了底層支撐工作的效率。我個(gè)人最近負(fù)責(zé)在工業(yè)方面的大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘方面的工作。
記者:黃總,您剛提到的客戶,偏政府背景的客戶好像比較多。
黃代恒:政府及大中型企業(yè),明略做的工業(yè)和金融是服務(wù)于企業(yè),公安和公共安全本來就是政府的。
記者:政府背景的服務(wù),安全一定要考慮,而且政府對安全問題會更加敏感。為什么明略的客戶會更偏向于政府?
黃代恒:是這樣的,其實(shí)大家會注意到,金融對數(shù)據(jù)、安全是很敏感的,工業(yè)大家可能認(rèn)為沒那么敏感。但實(shí)際來講,我們接觸的核心的建基和制造等部門,他們的所有數(shù)據(jù)都涉及到金融安全。明略項(xiàng)目的特征是基于客戶的數(shù)據(jù)來進(jìn)行挖掘分析,項(xiàng)目結(jié)束后全部數(shù)據(jù)也都留在重要的行業(yè)客戶手中。不像有些互聯(lián)網(wǎng)的數(shù)據(jù),可以進(jìn)行二次加工,把數(shù)據(jù)再次服務(wù)于其他客戶。明略服務(wù)的各企業(yè)、政府都把數(shù)據(jù)視作自己的核心,所以安全方面的工作是非常非常重要的。在數(shù)據(jù)的存儲和使用的權(quán)限控制領(lǐng)域,明略甚至還擁有該領(lǐng)域的專業(yè)產(chǎn)品,對數(shù)據(jù)的使用權(quán)限進(jìn)行控制。未經(jīng)授權(quán)的客戶,即使是登錄狀態(tài),選擇數(shù)據(jù)的時(shí)候也拿不到不符合權(quán)限的內(nèi)容。
記者:黃總,在之前的大連軟交會上,您分享了一個(gè)關(guān)于人工智能的主題,明略從大數(shù)據(jù)的解決方案開始聚焦人工智能的方向,您能介紹一下明略戰(zhàn)略調(diào)整的初衷是什么,目前做了怎樣的規(guī)劃呢?
黃代恒:這并不是一個(gè)戰(zhàn)略的變化。明略從最開始做大數(shù)據(jù),使其成為自己的標(biāo)簽,到現(xiàn)在偏向人工智能,這并不是轉(zhuǎn)型,而是順理成章的推進(jìn)。
我們把大數(shù)據(jù)當(dāng)做一個(gè)工具或手段,通過大數(shù)據(jù)我們會發(fā)現(xiàn),效率高了、以往分析不出來的現(xiàn)在可以了,這是大數(shù)據(jù)的價(jià)值。但實(shí)際上,從大數(shù)據(jù)本身來講,我們?yōu)槭裁丛敢飧冻龊艽蟮拇鷥r(jià)去琢磨它,就是希望通過大數(shù)據(jù)能夠發(fā)現(xiàn)事物本身的規(guī)律和特征。比如在金融行業(yè)發(fā)現(xiàn)正常還款人和非正常還款人以及行業(yè)交易中的危險(xiǎn)行為,也包括金融詐騙等,這些其實(shí)都是基于大數(shù)據(jù)的分析,本質(zhì)并沒有變化,但現(xiàn)在我們將其稱之為行業(yè)的人工智能。明略希望在金融、工業(yè)、公安這三個(gè)垂直行業(yè),結(jié)合專家智慧,將以往人工化的操作替換為機(jī)器操作,將產(chǎn)生的數(shù)據(jù)不斷進(jìn)行分析,后期慢慢脫離人的作用,形成基于大數(shù)據(jù)的行業(yè)智能,最終達(dá)到服務(wù)于人的目的。這個(gè)是明略一直在做的,所以不算是轉(zhuǎn)型而是必然。
記者:明略聚焦三個(gè)行業(yè),暫不提公安。就金融領(lǐng)域而言,由于它直接跟錢掛鉤,對數(shù)字、安全是特別敏感的。如果是基于大數(shù)據(jù)分析而開發(fā)出一系列行業(yè)人工智能解決方案,在這個(gè)過程當(dāng)中是如何進(jìn)行風(fēng)控的把握?在匹配各個(gè)行業(yè)不同的人工智能方案的時(shí)候,考慮到像金融行業(yè),它會有保險(xiǎn)、銀行、網(wǎng)貸等細(xì)分的領(lǐng)域,這是不是牽扯到了人工智能的定制化?
黃代恒:是這樣的,前面也提到了明略有三個(gè)基礎(chǔ)的產(chǎn)品,但無論是人工智能還是大數(shù)據(jù),都是伴隨著客戶的成長,因?yàn)槊總€(gè)客戶的真實(shí)數(shù)據(jù)是不一樣的。所以明略的30位數(shù)據(jù)專家不是在研究室里,也不是在辦公室里面,而是都在一線,跟我們的客戶去學(xué)習(xí),做到真正的了解這個(gè)行業(yè)。在金融領(lǐng)域,明略的主要業(yè)務(wù)就是聚焦風(fēng)險(xiǎn),進(jìn)行一些數(shù)據(jù)及用戶行為畫像的分析。我認(rèn)為金融實(shí)際上就是做風(fēng)險(xiǎn)的,主要分為三類:征信風(fēng)險(xiǎn)、行為風(fēng)險(xiǎn)和行業(yè)風(fēng)險(xiǎn)。而明略現(xiàn)在主要做的就是行為風(fēng)險(xiǎn),已經(jīng)很成熟了。包括為國內(nèi)頂級銀行實(shí)施的實(shí)時(shí)監(jiān)控方案、銀行審計(jì)部門的金融鏈條分析,甚至當(dāng)下的金融詐騙等都可以妥善應(yīng)對。以金融詐騙為例,這是一個(gè)很典型犯罪模式。犯罪分子如果騙了你的錢,他不會立刻取走,而是將其分散為數(shù)十個(gè)賬戶再進(jìn)行轉(zhuǎn)移。在這個(gè)過程中,我們會發(fā)現(xiàn)在整個(gè)犯罪鏈條中,會出現(xiàn)某一特定時(shí)段的特定規(guī)律,發(fā)現(xiàn)這個(gè)規(guī)律后,我們就可以提前將錢款凍結(jié),避免相關(guān)部門在事后進(jìn)行款項(xiàng)的追蹤。除此之外,還可以將防范手段升級,當(dāng)系統(tǒng)檢測到某一賬戶存在問題的時(shí)候,讓嫌疑人主動提供相關(guān)信息,并且鎖定賬戶,更進(jìn)一步的防止了詐騙行為的惡化。據(jù)明略客戶案例的實(shí)際數(shù)據(jù)表示,這個(gè)方案在銀行上線三個(gè)月后,成功攔截錢款300萬,按年化收益計(jì)算的話,一年大概可以為銀行攔截大概一千萬以上的問題錢款。而產(chǎn)生的這些效益,都是利用大數(shù)據(jù)分析技術(shù)為行業(yè)真真正正帶來的價(jià)值。
記者:黃總,您剛提到了一個(gè)數(shù)據(jù),三個(gè)月是三百萬左右,有一個(gè)問題,如果就是銀行上線了你這個(gè)項(xiàng)目,它一年的年化率可能達(dá)到了一千萬左右,對于銀行來說,它在這個(gè)項(xiàng)目上的投入和產(chǎn)出是怎樣的?
黃代恒:對于銀行來講,在這個(gè)項(xiàng)目上的投入是遠(yuǎn)遠(yuǎn)不及產(chǎn)出的,應(yīng)該不到半年就可以全部收回。所以對于銀行來講,風(fēng)控方面的內(nèi)需是比較強(qiáng)烈的,所以推進(jìn)程度也高于其他細(xì)分行業(yè),而這也是明略進(jìn)行金融細(xì)分領(lǐng)域選擇的重要依據(jù)。
記者:除了金融,明略還聚焦工業(yè)。而工業(yè)大數(shù)據(jù)這個(gè)提法跟智能制造是息息相關(guān)的。有人說工業(yè)大數(shù)據(jù)分析是智能制造的基礎(chǔ),也是未來我國實(shí)現(xiàn)智能化的一個(gè)重要的基石。您能介紹一下工業(yè)大數(shù)據(jù)分析在中國推進(jìn)智能制造的過程當(dāng)中起到了怎樣的作用?
黃代恒:大數(shù)據(jù)和人工智能是整個(gè)智能制造的基礎(chǔ),我認(rèn)為稍微有點(diǎn)夸大,應(yīng)該是重要的一部分。明略為什么要發(fā)展工業(yè)大數(shù)據(jù)?因?yàn)楣I(yè)本身就是一個(gè)巨大的市場。有個(gè)著名的百分之一理論:如果上萬億的市場,你可以做到百分之一,那最終你就能得到一百萬以上的市場。因?yàn)楣I(yè)是一個(gè)十分廣泛的領(lǐng)域,包括高端裝備制造、航空、風(fēng)力、發(fā)電、石油等,而且每時(shí)每刻都在產(chǎn)生巨大的數(shù)據(jù)。大家或許認(rèn)為公安和金融的數(shù)據(jù)量是很大的,但實(shí)際上數(shù)據(jù)量最大的是工業(yè)。在這個(gè)領(lǐng)域,不管是軌道交通還是風(fēng)力、發(fā)電,傳感器每時(shí)每刻都在采集溫度、濕度、轉(zhuǎn)速等各方面的數(shù)據(jù)。原來這些數(shù)據(jù)只是作為過程中的數(shù)據(jù)被使用,但現(xiàn)在這些數(shù)據(jù)信息已經(jīng)確確實(shí)實(shí)能夠?yàn)?ldquo;智造”帶來一些非常實(shí)際的作用。
記者:黃總,之前在軟交會的時(shí)候,聽了您基于軌道交通的工業(yè)大數(shù)據(jù)分享,您能以這個(gè)軌道交通為例,跟我們詳細(xì)介紹一下,如果將工業(yè)大數(shù)據(jù)分析的功能運(yùn)用到交通上面,我們會具體產(chǎn)生哪些顯性化的表現(xiàn)。
黃代恒:在軌交領(lǐng)域,實(shí)際上有很多的細(xì)分領(lǐng)域。但從大的層面來講,大致分為感知和洞察兩個(gè)方面。感知是可以靈敏的捕獲到已經(jīng)發(fā)生的事情,避免造成更大的問題;而洞察是可以發(fā)現(xiàn)隱藏在事件之后的東西。二者是不一樣的。
先說一下感知,大家現(xiàn)在都已經(jīng)是地鐵的用戶,早高峰的地鐵非常擠,如果某一天大家等了半個(gè)小時(shí),卻被告知地鐵故障無法按時(shí)發(fā)出,相信很多人是無法容忍的,因?yàn)檫@已經(jīng)影響了我們的生活。但這個(gè)問題實(shí)際上是可以通過數(shù)據(jù)分析解決的,當(dāng)一條地鐵線的制動出現(xiàn)問題,可能一兩站的時(shí)候影響不大,三四站的時(shí)候會有點(diǎn)影響,到了七八站的時(shí)候,他可能就跑不動了,這個(gè)時(shí)候影響就會很惡劣。而大數(shù)據(jù)在其中的作用是,雖然不能立刻把問題解決,但是可以在地鐵剛剛出現(xiàn)問題的時(shí)候進(jìn)行預(yù)警。因?yàn)楫?dāng)車上人員滿載的時(shí)候,制動系統(tǒng)的壓力是非常大的,如果出現(xiàn)問題,系統(tǒng)會提前一兩站預(yù)警,讓乘客下去換成另一趟列車,在空載的情況下,列車可以直接開回終點(diǎn)。雖然也對乘客造成了影響,但最終避免了整條線擁堵一上午的情況。在北京上海等大城市,每年發(fā)生地鐵擁堵的情況都是有次數(shù)限制的,而這些情況都可以依靠感知來避免造成更壞的結(jié)果。
洞察就是發(fā)生了故障,但不清楚具體原因。傳統(tǒng)采所取的辦法是專家維修或者每天檢修,以北京為例,地鐵運(yùn)維員工少則3000多則5000,但隨著地鐵線路的增加,以后可能會有上萬人來做這件事,這對于國家來講成本實(shí)在太大了。而大數(shù)據(jù)的洞察功能,可以對設(shè)備狀態(tài)進(jìn)行預(yù)測,使檢修得以簡化,系統(tǒng)可以對設(shè)備的健康狀態(tài)進(jìn)行打分,良好狀態(tài)下是70分,如果出現(xiàn)40分,那就要進(jìn)行維修,如果狀態(tài)很好就不需要維修了。這樣漸漸地把原來的按照計(jì)劃去維修,變成按狀態(tài)去維修,減輕人工成本的支出。
記者:工業(yè)大數(shù)據(jù)其實(shí)是基于大數(shù)據(jù)創(chuàng)新技術(shù)的應(yīng)用,目前在制造業(yè)的應(yīng)用成果如何?
黃代恒:工業(yè)大數(shù)據(jù)實(shí)際上是一個(gè)先導(dǎo)性研究,像風(fēng)電、石油、軌交等行業(yè),大概是在5、6年前就已經(jīng)有很多獨(dú)立的案例了。而且不光是企業(yè)還有學(xué)校,比如清華大學(xué)、國外著名學(xué)校等都做出了很多獨(dú)立的案件。再如航空發(fā)展企業(yè)、最大的石油開采企業(yè)等頂級企業(yè),享受到了數(shù)據(jù)基礎(chǔ)帶來的好處。但現(xiàn)在隨著深度學(xué)習(xí)和開源等技術(shù)的不斷改進(jìn),很多人包括供應(yīng)商和企業(yè)都成為了受益者。未來,技術(shù)的更迭推進(jìn)會越來越快,包括傳感器技術(shù)。
所以當(dāng)下我們說物聯(lián)網(wǎng)的應(yīng)用有三層:傳感層、傳輸層、設(shè)計(jì)層,而這三層正在以永遠(yuǎn)向前的加速度發(fā)展,未來可能很多的中等企業(yè),甚至一些小企業(yè),也能夠以一定的可負(fù)擔(dān)的代價(jià)去實(shí)現(xiàn)對人工智能的應(yīng)用。當(dāng)然,類似AlphaGo可能會比較貴,訓(xùn)練一個(gè)可能就要上百萬。所以明略現(xiàn)在不做強(qiáng)人工智能,而是做行業(yè)人工智能,期望在未來的發(fā)展中,讓中型企業(yè)甚至年產(chǎn)值只有幾千萬的企業(yè),也能夠從快速實(shí)現(xiàn)數(shù)據(jù)對接和模型套用。而這個(gè)也是需要一個(gè)過程的,最初肯定是個(gè)別企業(yè)可以使用,然后是少量企業(yè),最后才會惠及所有企業(yè)。
記者:黃總,您剛說到了制造業(yè)的智能化過程,之前跟一位嘉賓聊天的時(shí)候,他說智能制造的過程是分為幾個(gè)階段,先是設(shè)備的智能化,生產(chǎn)線的智能化,然后是車間的智能化,最后得到智能化的企業(yè)。如果應(yīng)用人工智能化的方案的話,首先肯定是要進(jìn)行設(shè)備的智能化,這其中的投入產(chǎn)出您怎么看?
黃代恒:你的觀點(diǎn)基本是對的,我剛才說的三層要配合,如果設(shè)備不具備感知也無法上傳,企業(yè)何談數(shù)據(jù)洞察!當(dāng)然,在實(shí)際操作中,設(shè)備的修改更換需要一大筆費(fèi)用。所以明略一般會選擇已經(jīng)具備一定條件的企業(yè),例如軌道交通。但如果汽車行業(yè),想快速實(shí)現(xiàn)數(shù)據(jù)的洞察,就不那么現(xiàn)實(shí),由于汽車的數(shù)據(jù)是沒有回傳的,所以汽車做不好了。而電車卻可以,因?yàn)楦鶕?jù)國家規(guī)定,電動車所有的數(shù)據(jù)是打包回傳的,因此,汽車在實(shí)現(xiàn)數(shù)據(jù)洞察上就不如電車。
而感知與洞察數(shù)據(jù)的過程是相互促進(jìn)的,傳感器即便現(xiàn)階段還比較貴,但如果我們確實(shí)可以扎扎實(shí)實(shí)的分析出結(jié)果,做一些預(yù)警和深度分析,能夠幫到中小型企業(yè)的話,我想大部分企業(yè)也會同意的,不會說特別抗拒。所以這需要我們踏踏實(shí)實(shí)去將技術(shù)融入到行業(yè),,從而推動行業(yè)發(fā)展方向,三層配合會越來越好,最終形成Dizygotic twins。一邊是物理設(shè)備,一邊是數(shù)字化反饋,這樣一個(gè)數(shù)碼的孿生兄弟就會完整的建立起來。
記者:黃總,您剛才提到中國智能制造進(jìn)程的三個(gè)環(huán)節(jié)要配合發(fā)展。您認(rèn)為當(dāng)下的制造業(yè)推進(jìn)智能制造的過程,到了哪個(gè)階段?距離國家提出的中國制造2025戰(zhàn)略,還剩八年的時(shí)間,我們還能做什么?
黃代恒:對,八年時(shí)間還是挺長的。很久以前就有一些孤癥,國外的大公司也展開過一些先天性的研究。現(xiàn)在,我們國家也慢慢跟上來了,去發(fā)展市場,但是目前我們的起點(diǎn)并不高。估計(jì)目前市場上提供大型平臺解決方案的先導(dǎo)企業(yè)可能還不足十分之一,而且還都是在很先進(jìn)的行業(yè),但整個(gè)過程一定是趨于穩(wěn)健發(fā)展的態(tài)勢。
有一句話是這樣說的:對技術(shù)的學(xué)習(xí)越來越快,對行業(yè)的學(xué)習(xí)還保持不變。以明略為例,最初我們可能花了兩三年的時(shí)間建立了一個(gè)堅(jiān)實(shí)的國內(nèi)領(lǐng)先的大數(shù)據(jù)解決方案;后來開始做知識圖譜,這個(gè)我們可能用一年半、兩年的時(shí)間就可以掌握得很不錯(cuò)了;隨著開源的上升,到研究知識學(xué)習(xí)、自然語言解析,這個(gè)時(shí)候我們可能只要半年的時(shí)間就夠了。所以我們發(fā)現(xiàn)知識、學(xué)習(xí)知識的速度在不斷加快,在這八年的發(fā)展期間,在知識領(lǐng)域,我們一定是向上發(fā)展變化的。
那么在這個(gè)過程中,什么是沒有變得?是對行業(yè)的學(xué)習(xí),我們?nèi)チ私膺@個(gè)行業(yè),需要具備一定的素養(yǎng),真的需要懂這個(gè)行業(yè)。我在接觸工業(yè)領(lǐng)域的兩年,依然感覺自己還是小學(xué)生?;旧隙@個(gè)行業(yè)的,都是一些老專家,為什么他們知識那么寶貴?他們只聽聲音就可以知道發(fā)動機(jī)是不是正常運(yùn)作,而這種能力是在于對行業(yè)的理解。
所以我對工業(yè)企業(yè)的建議是,當(dāng)下你可能認(rèn)為做這個(gè)事情還不能立刻產(chǎn)生價(jià)值,但如果你提早開始,將來就能用更先進(jìn)的手段、行業(yè)的技術(shù)去做更先進(jìn)的事情。你不會直接吃第七個(gè)饅頭就飽了,前面肯定是有第一個(gè)第二個(gè)的。所以目前我們還不算先進(jìn),還處于追趕階段,比起歐美各國,不管是硬件還是軟件,我們都還在加速發(fā)展,而且是以疊加的速度在加速,不是一點(diǎn)一點(diǎn)加速的,尤其在數(shù)據(jù)基礎(chǔ)上,我們可能會實(shí)現(xiàn)彎道超車。
記者:明白了,黃總,那我們今天的訪談先到這里。尊敬的各位ENI會員,今天的零距離就到這里就結(jié)束了,我們下期再見。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。