Google于今早在舊金山舉行的Google Cloud Next會(huì)議上確認(rèn)將收購(gòu)數(shù)據(jù)科學(xué)競(jìng)賽平臺(tái)Kaggle,但沒(méi)有公開(kāi)收購(gòu)條款細(xì)節(jié)。
圖:2017年3月9日Kaggle社區(qū)最新排名
這項(xiàng)收購(gòu)并不出人意料。Kaggle在平臺(tái)上擁有50萬(wàn)數(shù)據(jù)科學(xué)家,它將使Google能夠立即在AI社區(qū)中拓展其覆蓋范圍。隨著谷歌與亞馬遜在云計(jì)算領(lǐng)域的競(jìng)爭(zhēng)難分伯仲,它將需要盡可能多的制勝點(diǎn)。
這也將幫助谷歌在數(shù)據(jù)科學(xué)社區(qū)中更加扎實(shí)地確立其品牌--盡管得益于其像TensorFlow這樣的項(xiàng)目,它已經(jīng)是主角之一。谷歌面臨著日益激烈的競(jìng)爭(zhēng),因?yàn)?a href=http://www.yizongshi.cn/index.php?m=content&c=index&a=infolist&typeid=1&siteid=1&type=keyword&serachType=2&key=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD style='color:#57A306' target='_blank'>人工智能領(lǐng)域已經(jīng)向自動(dòng)駕駛和深度學(xué)習(xí)等垂直領(lǐng)域發(fā)展,公司不論大小都可以分到一杯羹。這從理論上可以將谷歌排除在最佳人工智能操作公司名單之外,雖然谷歌旗下的阿爾法狗剛剛戰(zhàn)勝圍棋世界冠軍。
購(gòu)買(mǎi)Kaggle及其在人工智能社區(qū)內(nèi)的知名度也可能有助于招聘。Google需要確保它不斷吸收專門(mén)從事深度學(xué)習(xí)的最佳人才,與其他公司(例如Pinterest(專注于視覺(jué)搜索))競(jìng)爭(zhēng)。即使并不是一個(gè)比較專業(yè)化的技術(shù)收購(gòu),收購(gòu)也意味著谷歌正在擴(kuò)大關(guān)注范圍,以探索更深入不同類(lèi)別的方法,以確保其在人工智能的主導(dǎo)地位。
據(jù)估計(jì),Google會(huì)保證Kaggle繼續(xù)運(yùn)營(yíng)其服務(wù)-并保留其當(dāng)前名稱。
Kaggle由Goldbloom和Ben Hamner于2010年創(chuàng)立。企業(yè)和研究人員在Kaggle上發(fā)布數(shù)據(jù),讓全世界的統(tǒng)計(jì)師和數(shù)據(jù)科學(xué)家對(duì)數(shù)據(jù)集進(jìn)行建模和分析,以競(jìng)賽的形式評(píng)選出最佳模型。Kaggle的眾包競(jìng)賽模式的價(jià)值在于,讓人們有可能從無(wú)窮無(wú)盡的建模方法中,尋找到最優(yōu)解。作為一個(gè)舉辦數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)競(jìng)賽的平臺(tái),盡管早期有一些競(jìng)爭(zhēng)對(duì)手,如DrivenData,TopCoder和HackerRank,Kaggle已經(jīng)通過(guò)特別的市場(chǎng)定位,將它們遠(yuǎn)遠(yuǎn)甩在后面。它已經(jīng)是數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)競(jìng)賽領(lǐng)域當(dāng)之無(wú)愧的大哥大。
Kaggle也有一些與谷歌的“歷史淵源”,就在本月初,Google和Kaggle合作舉辦了一場(chǎng)價(jià)值100,000美元的機(jī)器學(xué)習(xí)競(jìng)賽,圍繞YouTube視頻進(jìn)行分類(lèi)。這場(chǎng)比賽也與Google Cloud Platform進(jìn)行了深入的整合。
雖然谷歌的收購(gòu)主要基于Kaggle所構(gòu)建的社區(qū)、而不是其技術(shù)價(jià)值,Kaggle自身也針對(duì)數(shù)據(jù)科學(xué)競(jìng)賽開(kāi)發(fā)了不少有用的工具。數(shù)據(jù)科學(xué)家可以使用一個(gè)基于云的平臺(tái)Kaggle Kernels(曾經(jīng)被稱為Scripts)運(yùn)行數(shù)據(jù)分析和建模的代碼、將源代碼分享給他人以得到社區(qū)中的反饋意見(jiàn),以及將源代碼展示在自己的Kaggle資料中。這樣,企業(yè)將非常容易看到Kaggle競(jìng)賽中排名靠前的選手所做過(guò)的工作,這也是數(shù)據(jù)工作者競(jìng)相爭(zhēng)取更高Kaggle排名的原因(當(dāng)然,另一個(gè)原因是企業(yè)為最佳數(shù)據(jù)分析結(jié)果給出的巨額獎(jiǎng)金!)。
Kaggle的另一項(xiàng)服務(wù)是其網(wǎng)站上的招聘信息發(fā)布。目前還不知道谷歌將如何處理這項(xiàng)業(yè)務(wù)。
圖:Kaggle招聘服務(wù)
根據(jù)Crunchbase,Kaggle從2010年推出以來(lái),籌集了1250萬(wàn)美元(PitchBook說(shuō)是1275萬(wàn)美元)。Kaggle的投資者包括Index Ventures,SV Angel,Max Levchin,Naval Ravikant,Google首席經(jīng)濟(jì)學(xué)家Hal Varian,Khosla Ventures和Yuri Milner。
以下為Kaggle的 CEO,Anthony Goldbloom的演講內(nèi)容:
我很自豪和興奮地宣布,Kaggle準(zhǔn)備加入谷歌云!
七年前,我們發(fā)起了第一場(chǎng)競(jìng)賽,以預(yù)測(cè)歐洲歌唱大賽的投票模式。Jure Zbontar贏了,他擊敗其它的21支隊(duì)伍,贏得1000美元的獎(jiǎng)金。
從那以來(lái),Kaggle社區(qū)已經(jīng)使用機(jī)器學(xué)習(xí)來(lái)為高中作文打分,診斷心力衰竭和提高希格斯玻色子發(fā)現(xiàn)的顯著性。 Geoff Hinton和George Dahl在默克競(jìng)爭(zhēng)中展示了深層神經(jīng)網(wǎng)絡(luò)的力量,Tianqi Chen使用Kaggle Kernels向XGBoost介紹了社區(qū)。 Kaggle的個(gè)人資料庫(kù)已經(jīng)成為一項(xiàng)公認(rèn)的認(rèn)證證明,社區(qū)成員在這里完成從DeepMind到沃爾瑪公司的工作。去年8月,我們推出了一個(gè)開(kāi)放的數(shù)據(jù)平臺(tái),社區(qū)已經(jīng)共享了數(shù)百個(gè)高質(zhì)量的數(shù)據(jù)集。在Kaggle社區(qū),我們已經(jīng)一起取得了很多重要進(jìn)展!
Kaggle的團(tuán)隊(duì)將作為一個(gè)整體加入Google Cloud,并將保留Kaggle的獨(dú)特品牌。我們將繼續(xù)發(fā)展我們的競(jìng)賽和開(kāi)放數(shù)據(jù)平臺(tái),繼續(xù)對(duì)所有數(shù)據(jù)科學(xué)家、公司、方法和技術(shù)開(kāi)放。 Kaggle Kernels將繼續(xù)支持源自Google多樣化生態(tài)系統(tǒng)的機(jī)器學(xué)習(xí)庫(kù)和包,也會(huì)繼續(xù)支持那些并非源自Google的工具包。
Kaggle加入Google將允許我們實(shí)現(xiàn)更多目標(biāo)。它將世界上最大的數(shù)據(jù)科學(xué)社區(qū)與世界上最強(qiáng)大的機(jī)器學(xué)習(xí)云相結(jié)合。更令人振奮的是,這還能聯(lián)合ImageNet創(chuàng)作者李飛飛和李佳的力量。
將Google云技術(shù)接入我們的社區(qū)后,我們將能夠接入強(qiáng)大的基礎(chǔ)架構(gòu)、可擴(kuò)展的培訓(xùn)和部署服務(wù),以及存儲(chǔ)和查詢大型數(shù)據(jù)集的能力。
感謝所有人為建立我們超級(jí)棒的社區(qū)所付出的努力。我無(wú)比期待接下來(lái)能和你們一起實(shí)現(xiàn)更多。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。