“拉薩發(fā)現(xiàn)首例新冠肺炎確診病例,急尋從武漢武昌到西寧,從西寧到拉薩的Z264次、Z265次同車廂旅客。”
“4個航班發(fā)現(xiàn)確診患者,急尋同行旅客”
“緊急擴散!廣元急尋以下車次乘客”
……
打開搜索引擎輸入“急尋”,可以看到下拉聯(lián)想詞基本都是和尋找患者同行人相關內容??梢?,防控疫情的戰(zhàn)場,不僅僅在于醫(yī)療一線的救死扶傷,更需要做好人群流動信息,洞察疫情擴散情況,控制好傳播途徑,進而抑制疫情的過快擴散,保護更多人的健康和生命安全。
這一切,離不開強大的大數(shù)據(jù)分析技術。
疫情就是命令 大年三十成立項目組 馳援某政府客戶
“我們這里有大量的疫情相關數(shù)據(jù),但是卻摸不清頭緒,無從下手,急需要模分析模型。”
春節(jié)期間,奇安信大數(shù)據(jù)與態(tài)勢感知公司陸續(xù)收到了某部委及全國多個省市的下屬機關的緊急需求。該部委作為此次疫情防控的重要支撐單位,為了更高效推進工作,第一時間向奇安信集團發(fā)出數(shù)據(jù)分析技術的請求,希望利用大數(shù)據(jù)技術分析轄區(qū)內的疫情擴散情況,為精準防控提供數(shù)據(jù)支撐。
疫情就是命令!奇安信連夜成立態(tài)勢感知應急項目組,陸續(xù)召集了22人擅長大數(shù)據(jù)分析的精兵強將,按照就近原則,連夜奔赴前線,給客戶提供駐場貼身服務。
“因為過年車很難打,加上很多地方開始交通管制,到客戶現(xiàn)場也很不容易,甚至有位同事在下雪天徒步走了2個多小時。”項目負責人李虎回顧道,“比交通問題更大的困難,這次客戶提出的需求是全新的,需要高度定制化的開發(fā)和服務,而且復雜度遠遠超出想象。”
大家都知道,奇安信本身是一家安全公司,在感知網絡安全態(tài)勢方面無出其右,可這次感知疫情態(tài)勢,盡管二者之間有相通的地方,卻也是大姑娘上花轎——頭一遭。
面對全新的需求,時間緊且任務重。在首批項目組到達一線的第二天,李虎果斷決定又專門成立了40多人二線團隊,涵蓋產品、售前、研發(fā)、數(shù)據(jù)、測試等多條業(yè)務線,全力保障前線同事們的后勤。
數(shù)據(jù)一條條看,模型一個個建,bug一個個改
果不其然,項目初期并非一帆風順。試想,疫情發(fā)生以后有幾百萬人從武漢流向全國各地,有坐火車的、有坐飛機的還有自駕的,這些都有可能是潛在的傳染源。他們什么時間到過哪些地方、接觸過那些人,面對如此龐雜、海量的數(shù)據(jù),一線的分析師需要從中抽絲剝繭,并且放到系統(tǒng)里面進行建模分析,這個難度是可想而知的。
李虎回憶,一線同事初到現(xiàn)場之時,由于數(shù)據(jù)比較少,質量也很一般,很難直接開戰(zhàn)模型訓練和結果驗證工作。為了解決這些難題,一線同事不厭其煩,反復研究了疫情數(shù)據(jù)的特點,人工一條條的進行數(shù)據(jù)篩選和補全,工作量巨大,每天都是半夜12點后才離開客戶現(xiàn)場;在建模過程中,與用戶保持密切溝通,確定每個模型所需的數(shù)據(jù)資源、關鍵特征、衡量標準等,并基于這些數(shù)據(jù)展開模型訓練和分析工作,確保模型能夠迅速投入實戰(zhàn)。
隨著數(shù)據(jù)量的劇增,數(shù)據(jù)的各字段信息也相對完整,數(shù)據(jù)本身的問題基本得以解決,但數(shù)據(jù)分析的難度陡然上升。況且疫情發(fā)展到這樣一個地步,已經出現(xiàn)了二代甚至三代傳播,數(shù)據(jù)分析的難度就更大了。為確保模型輸出的數(shù)據(jù)結果快速而又準確,研發(fā)同事連夜設計出了能夠自動化數(shù)據(jù)處理的腳本文件,大大提高了現(xiàn)場大規(guī)模數(shù)據(jù)的處理和分析效率。
后臺的工作一樣辛苦。同事們的電話聲徹夜不休,用來聊天打字的手都已經僵住了,為的就是準確、快速響應一線需求。研發(fā)同事們的鍵盤敲擊聲鏗鏘有力,為此他們還要時不時回過頭,生怕吵醒身后熟睡的孩子,偶爾捋捋僅剩的一小撮頭發(fā)。就這樣,一行行代碼在電腦屏幕上滾動著。
為了避免忙中出錯,研發(fā)組毫不敢放松,一邊開發(fā),一邊加大了對bug的檢測力度。果然,從中揪出了20多個bug。為了盡快解決bug,按時交付系統(tǒng)并上線運行,老馬拎起一大袋子方便面就坐在了電腦前,結果是bug解決了,系統(tǒng)按時交付上線了,自己也因泡面吃得太多上火了。
20個模型、超1000萬條數(shù)據(jù) “疫情態(tài)勢圖”助力精準決策
據(jù)不完全統(tǒng)計,在前線、后方兩線同事的緊密配合下,依托奇安信大數(shù)據(jù)智能建模平臺,項目組共搭建了近20個數(shù)據(jù)分析模型,處理了超過1000萬條數(shù)據(jù),并且通過可視化大屏,繪制出了一張精準的“疫情態(tài)勢圖”,為當?shù)毓矙C關研判疫情態(tài)勢、排查密切接觸人員、控制傳播途徑,提供了精準的決策支撐。
“如果這些定制化需求擱在平時,且要在短時間完成巨大工作量,以及如此復雜的數(shù)據(jù)分析和模型開發(fā),簡直就是天方夜譚。”李虎感慨到。
此時此刻,抗擊疫情的大數(shù)據(jù)分析及態(tài)勢感知會戰(zhàn)還在緊張的進行,每一位參與其中的同事都在竭盡全力。如果說在傳統(tǒng)戰(zhàn)爭中,情報是決定勝負的要素的話,那么在這場信息化為特征的全民戰(zhàn)“疫”中,數(shù)據(jù)就是情報,就是指揮決策的依據(jù),是打贏這場阻擊戰(zhàn)的重中之重。而作為網絡安全國家隊,奇安信旗下態(tài)勢感知團隊依托自身強大的大數(shù)據(jù)分析和智能建模能力,全力為國家相關部門提供技術保障,盡早贏下這場“戰(zhàn)疫”!
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網頁分享至朋友圈。