“上知天文、下知地理”的 ChatGPT火了,數(shù)據(jù)這門資產(chǎn)的重要性,從未提升到如此高度。
大量非結(jié)構(gòu)化數(shù)據(jù),潛伏在由數(shù)十億互聯(lián)設(shè)備、無(wú)數(shù)云服務(wù)包裹的數(shù)字世界。轉(zhuǎn)化這些混亂無(wú)序的數(shù)據(jù),帶來(lái)相當(dāng)可觀的信息價(jià)值。
今年 1 月宣布完成 C 輪融資的日志易,做的就是這門轉(zhuǎn)化的生意。
這家日志管理與分析平臺(tái)開發(fā)商,幫企業(yè)挖掘和利用機(jī)器數(shù)據(jù)價(jià)值,企業(yè)IT系統(tǒng)、設(shè)備每時(shí)每刻產(chǎn)生的日志,是它的拿手領(lǐng)域。
14 年前,39 歲的陳軍接到一通獵頭電話,毅然決定離開待了 12 年的硅谷,回國(guó)發(fā)展。輾轉(zhuǎn)騰訊、高德等公司幾年后,2014 年他創(chuàng)辦日志易,選定 IT 運(yùn)維分析的創(chuàng)業(yè)方向。
公司成立當(dāng)月,還沒有產(chǎn)品,就拿到徐小平真格基金等投資者 1400 萬(wàn)元的天使輪。而后紅杉兩輪加持,C 輪融資在 2022 年,整個(gè)企業(yè)服務(wù)賽道都相當(dāng)艱難的背景下完成。
自 2015 年起,公司連續(xù)數(shù)年銷售收入同比增長(zhǎng)超 100%,2022 年?duì)I收過億,目前已服務(wù)超 700 家大型企業(yè)和機(jī)構(gòu),標(biāo)桿客戶包括中國(guó)銀行、光大證券、國(guó)家稅務(wù)總局等。
“IT 運(yùn)維是道生命線。”陳軍形容其為水和電,“大家習(xí)慣了一打開開關(guān)就有電,擰開水龍頭就有水,很難感知其重要性,但一旦停電停水,影響非常大。IT 運(yùn)維也是這樣。”
選在繁忙的會(huì)議間隙,陳軍和《21CBR》聊了聊IT運(yùn)維行業(yè)的變化、日志易的創(chuàng)業(yè)故事以及公司接下來(lái)的規(guī)劃。以下是陳軍的自述:
IT人生
我接觸計(jì)算機(jī)很早。
母親是廣東海洋大學(xué)計(jì)算機(jī)教授,我從小耳濡目染,6 歲開始玩舊式的計(jì)算機(jī)打孔紙片,14 歲開始學(xué) Basic 編程語(yǔ)言,90 年代中期成為第一代網(wǎng)民。
1998 年,從美國(guó)南加州大學(xué)碩士畢業(yè)以后,我一直在硅谷工作,從思科到谷歌,主要做云計(jì)算和搜索開發(fā)。
2009 年,一個(gè)越洋獵頭電話,讓我回國(guó)加入騰訊,做大規(guī)模數(shù)據(jù)中心運(yùn)維及云計(jì)算,而后又轉(zhuǎn)戰(zhàn)高德做技術(shù)副總裁。2014 年高德被阿里收購(gòu)以后,我想,是時(shí)候出來(lái)做點(diǎn)事了。
分析各種創(chuàng)業(yè)方向,美國(guó)的 Splunk 用搜索引擎來(lái)處理日志的想法很獨(dú)特,給我留下挺深的印象。Splunk 在 2011 年進(jìn)入中國(guó)市場(chǎng),售價(jià)昂貴,當(dāng)時(shí)沒有國(guó)內(nèi)公司做同類的產(chǎn)品,市場(chǎng)存在機(jī)會(huì)。
2014 年初日志易成立,我們成為第一家用搜索引擎來(lái)處理日志的中國(guó)企業(yè)。
所謂日志,是計(jì)算機(jī)系統(tǒng)所產(chǎn)生的機(jī)器數(shù)據(jù),蘊(yùn)含大量能直觀反映系統(tǒng)運(yùn)行狀況的重要信息,有非結(jié)構(gòu)化的特點(diǎn)。
傳統(tǒng)做法是用數(shù)據(jù)庫(kù)對(duì)日志進(jìn)行存儲(chǔ)和分析,但效率不高,且數(shù)據(jù)庫(kù)不適用日志這種沒有固定格式的數(shù)據(jù)。若利用搜索引擎,抽取字段將日志文本做類似網(wǎng)頁(yè)搜索的處理,IT 人員可以用關(guān)鍵詞搜索任意數(shù)據(jù),并能在此基礎(chǔ)上做各式各樣的分析。
這件事要想做成,需要兩方面的能力,一得懂IT運(yùn)維監(jiān)控,二得懂搜索引擎,把搜索這個(gè) To C 的東西,轉(zhuǎn)化成為日志處理的工具。恰好,創(chuàng)始團(tuán)隊(duì)擁有這兩塊技術(shù)背景。
公司成立的同年 10 月,產(chǎn)品就做出來(lái)了。起初是 SaaS 版本,放在公有云上,并在 2015 年 1 月拿到第一筆收入,來(lái)自一家小型創(chuàng)業(yè)公司,給了 1 萬(wàn)多塊錢。
嘗試了半年,我們得出來(lái)一個(gè)判斷,做 SaaS 賺不到錢,也很難吸引大客戶。公司馬上調(diào)整方向,決心做本地化部署,主攻大型企業(yè)。
金融、運(yùn)營(yíng)商、能源等行業(yè),是公司重點(diǎn)布局的領(lǐng)域。
這些行業(yè)每天面臨海量數(shù)據(jù)的產(chǎn)生,痛點(diǎn)很明顯:日志數(shù)據(jù)產(chǎn)生于不同業(yè)務(wù)部門,分散在不同服務(wù)器上,規(guī)??蛇_(dá)上百TB級(jí),缺乏集中收集和管理;系統(tǒng)一旦出現(xiàn)問題,需要登錄服務(wù)器進(jìn)行事后手動(dòng)查找和分析,這個(gè)過程耗時(shí)且效率低。
以一個(gè)統(tǒng)一日志管理平臺(tái),對(duì)日志實(shí)現(xiàn)集中采集、存儲(chǔ)和實(shí)時(shí)索引,乃至分析、可視化和監(jiān)控告警,實(shí)現(xiàn)的是日志全生命周期管理。相當(dāng)于把事后管理變成事中,一出現(xiàn)故障苗頭,秒級(jí)告警。
T 型戰(zhàn)略
日志易的早期產(chǎn)品版本,是基于通用開源軟件做的。服務(wù)大客戶時(shí),我們意識(shí)到,TB 級(jí)別的數(shù)據(jù)量,開源軟件無(wú)法滿足處理需求,不可持續(xù)。公司必須開發(fā)自己的搜索引擎。
想法真正落地,花了 3 年。2018 年底,公司發(fā)布了自研日志搜索引擎 Beaver,技術(shù)指標(biāo)較開源搜索引擎有大幅提升,填補(bǔ)了國(guó)產(chǎn)空白。
做自研的同時(shí),雙線并行,老業(yè)務(wù)依舊在同步發(fā)展,不斷疊加功能,這是考慮到一旦停下,市場(chǎng)份額無(wú)法繼續(xù)增長(zhǎng)甚至倒退,會(huì)有經(jīng)營(yíng)風(fēng)險(xiǎn)。
從產(chǎn)品競(jìng)爭(zhēng)力來(lái)看,日志易的優(yōu)勢(shì)主要在于兩方面。
其一,自研的搜索引擎技術(shù),數(shù)據(jù)處理性能提升 5-10 倍,可處理 PB 級(jí)新增海量日志,能完全實(shí)現(xiàn)自主可控,同時(shí)硬件成本減少 50%。
其二,自研的低代碼搜索處理語(yǔ)言 SPL(Search Processing Language),專為日志分析而生,和傳統(tǒng)的數(shù)據(jù)庫(kù)查詢語(yǔ)言 SQL 相比更加靈活,具有上手快、開發(fā)快、運(yùn)行快等優(yōu)勢(shì),可實(shí)現(xiàn)“在搜索框里編程”。
過去幾年,我們以日志產(chǎn)品為核心,開始向更多領(lǐng)域橫向拓展業(yè)務(wù),發(fā)展的邏輯可以概括為“T 型戰(zhàn)略”。
所謂“T 型”,一豎即深耕日志,深挖機(jī)器大數(shù)據(jù)的價(jià)值,一橫指延伸開來(lái)的場(chǎng)景,已形成三條產(chǎn)品線,運(yùn)維分析、安全分析、數(shù)據(jù)治理,每個(gè)產(chǎn)品線下又有多個(gè)產(chǎn)品,由此形成產(chǎn)品矩陣。
比如,安全分析這塊,2019 年切入,目前已有 SIEM 安全大數(shù)據(jù)分析平臺(tái)、用戶實(shí)體行為分析 UEBA 等安全產(chǎn)品。
當(dāng)前市面上做安全態(tài)勢(shì)感知的廠商,很多基于國(guó)外開源日志搜索軟件二次開發(fā),一天只能處理幾百 GB 的數(shù)據(jù)量,再往上走非常吃力,并且安全分析規(guī)則內(nèi)置固化在產(chǎn)品里,變通性較差,安全攻擊往往“道高一尺,魔高一丈”。
日志易基于SPL 的安全事件分析,較傳統(tǒng)的內(nèi)置安全分析規(guī)則,可擴(kuò)展性更強(qiáng),分析是隨時(shí)隨地進(jìn)行的。產(chǎn)品在應(yīng)對(duì)新的安全攻擊的時(shí)候,能不斷演進(jìn),對(duì)客戶來(lái)說(shuō),這也是投資保護(hù),不至于因?yàn)楫a(chǎn)品過時(shí)而需要定期購(gòu)買新產(chǎn)品。
回過頭來(lái)看日志易的開發(fā)節(jié)奏,從公司成立到拿下第一個(gè)大客戶,日志分析產(chǎn)品花了 18 個(gè)月,安全產(chǎn)品從 2019 年 5 月開發(fā)到簽下第一個(gè)大型股份制銀行客戶,也是 18 個(gè)月。
公司積累沉淀了一套產(chǎn)品開發(fā)方法論,從產(chǎn)品設(shè)計(jì)到簽下行業(yè)標(biāo)桿大客戶,基本用時(shí)不到 2 年。
跨越鴻溝
做 To B 的軟件企業(yè),得邁過兩道坎,16% 的市場(chǎng)滲透率、1 個(gè)億的收入。對(duì)日志易來(lái)說(shuō),我們跨越了鴻溝。
日志易瞄準(zhǔn)中國(guó)最大的 3000 家企業(yè)和機(jī)構(gòu),它們年度IT預(yù)算基本過億,對(duì)IT運(yùn)維有著極高要求。目前進(jìn)度已到 700 多家,市場(chǎng)滲透率超過 20%,金融行業(yè)的滲透率更高,約超 30%。
2021 年,公司實(shí)現(xiàn)訂單金額過億,2022 年訂單金額、營(yíng)收均過億,營(yíng)收增長(zhǎng)超 30%。
行業(yè)分布來(lái)看,金融、運(yùn)營(yíng)商、能源等行業(yè)客戶貢獻(xiàn)較大,且老客戶復(fù)購(gòu)率較高,客單價(jià)逐年穩(wěn)步提升。
IT 運(yùn)維領(lǐng)域,對(duì)新技術(shù)的追趕,中國(guó)大約落后美國(guó)五年。
中國(guó)IT 支出占 GDP 的比重僅 1.4%,相較美國(guó)的 4.7% 仍有較大差異;中國(guó)的 GDP 占了全球的 1/6,但I(xiàn)T支出只占全球的 12%,同樣不成正比;軟件開支差異更大,中國(guó)軟件支出占 GDP 的 0.1%,美國(guó)是 1.1%。
未來(lái)中國(guó)的企業(yè)和政府數(shù)字化轉(zhuǎn)型,仍有巨大紅利和增長(zhǎng)空間。
近幾年,自主可控的 IT 信創(chuàng)如火如荼,大量核心組件需要逐步從原來(lái)國(guó)外大廠的成熟產(chǎn)品替換為新開發(fā)的信創(chuàng)產(chǎn)品,新產(chǎn)品的穩(wěn)定性有待提升,給 IT 系統(tǒng)的運(yùn)維監(jiān)控和排障帶來(lái)新挑戰(zhàn)。
日志易 2020 年開始投入信創(chuàng)領(lǐng)域,已實(shí)現(xiàn)國(guó)產(chǎn)信創(chuàng)操作系統(tǒng)的全部適配,堅(jiān)定看好這個(gè)方向。
新興技術(shù)方面,公司在 2018 年開始開發(fā)智能運(yùn)維的產(chǎn)品,將機(jī)器學(xué)習(xí)的算法用在運(yùn)維領(lǐng)域。
ChatGPT 的出現(xiàn),帶給了我們啟發(fā),已在著手研究如何利用過去 9 年在機(jī)器大數(shù)據(jù)分析領(lǐng)域的積累,結(jié)合 ChatGPT 這類通用大模型,搭建日志分析的 ChatGPT,“培養(yǎng)”一個(gè)專攻 IT 運(yùn)維知識(shí)的 AI 專家。
中長(zhǎng)期而言,我們希望能在三至五年內(nèi),完成科創(chuàng)板上市的目標(biāo)。終極愿景,則是成為機(jī)器大數(shù)據(jù)領(lǐng)域的龍頭,服務(wù)幾千家大型企業(yè)客戶。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。