大數(shù)據(jù)初創(chuàng)企業(yè) WibiData 剛剛在 B 輪獲了 1500 萬美元的融資。
此輪融資由 Canaan Partners 領投,原有投資者 NEA 及 Google 董事會主席施密特也有參與。
WibiData由大數(shù)據(jù)初創(chuàng)企業(yè)Cloudera的聯(lián)合創(chuàng)始人 Christophe Bisciglia 及 Aaron Kimball 創(chuàng)建。創(chuàng)建伊始他們并沒有什么大計劃,只是希望能成為最早為基于Hadoop的應用之商用套件提供商之一。
大數(shù)據(jù)的市場已經(jīng)十分擁擠,Hadoop 的三巨頭(Cloudera、Hortonworks 及 MapR)牢牢占據(jù)了絕大部分的份額。但是大家用 Hadoop 絕不僅僅是為了將非結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)(即 ETL,數(shù)據(jù)析取),用戶開發(fā)自行的定制應用仍然是個難題。所以 WibiData 瞄準了這樣一個利基市場—做專業(yè)大數(shù)據(jù)軟件包。
能源管理初創(chuàng)企業(yè) Opower 就是一個用戶案例。這家公司已經(jīng)是 Cloudera 的招牌客戶了,但是當他們想讓自己的 SaaS 工具超越批量分析和 ETL 處理時,還是得找 WibiData。有了新應用的支持,現(xiàn)在這家公司已經(jīng)從晚間對用戶的能源使用進行數(shù)據(jù)比較分析提升到向用戶動態(tài)推薦了。
WibiData 的核心技術(shù)是將后端的 Hadoop 環(huán)境與面向客戶的預測性應用連接到一起,包括一組 HBase(Hadoop 數(shù)據(jù)庫)、數(shù)據(jù)格式化工具以及機器學習算法(WibiData 正在逐步將實現(xiàn)機器學習算法的 Kiji 開源)。此外,WibiData 還在總結(jié)其為同一領域內(nèi)的客戶所開發(fā)的應用之相似性,以便找出可重用的東西。比方說,零售業(yè)要想開發(fā)推薦引擎的話,應該從何開始?
WibiData 準備重點針對金融和零售業(yè)推進應用開發(fā)。預期的成型產(chǎn)品將會包括數(shù)據(jù)格式化的預定義模式、預置預測模型等。此外,軟件還將根據(jù)用戶角色的不同(數(shù)據(jù)科學家、系統(tǒng)工程師、業(yè)務用戶)而展現(xiàn)不同的界面,根據(jù)用戶需要來提供與數(shù)據(jù)的交互方式。
我們之前曾討論過,數(shù)據(jù)科學家無需太多,讓大數(shù)據(jù)好用就行了。WibiData 的專業(yè)化軟件包顯然是一種循序漸進的解決方案。此外,像 Cloudera 這樣的 Hadoop 供應商則采取了另一種大數(shù)據(jù)應用通用化的路線,即將 Hadoop 集成到現(xiàn)有環(huán)境中。時間會證明 WibiData 的路線是否正確的。
相關(guān)閱讀