企業(yè)應(yīng)用歷程回顧及未來展望(三): 云時(shí)代的BI
一家云計(jì)算公司為什么要投入如此多的資金去收購數(shù)據(jù)可視化公司,僅僅是為了提升數(shù)據(jù)分析和展示的能力,從而為企業(yè)提供更多的服務(wù)么?另外,傳統(tǒng)的BI廠商和云計(jì)算廠商結(jié)合后,是否會(huì)加速數(shù)據(jù)上云的過程,提升PAAS平臺(tái)的服務(wù)能力呢 ?未來,商業(yè)智能最核心的價(jià)值和競(jìng)爭(zhēng)力是什么
商業(yè)智能又被稱為BI,主要指商業(yè)領(lǐng)域的數(shù)據(jù)分析和可視化展示。提到BI,最近的一則新聞似乎在行業(yè)里引起轟動(dòng),那就是領(lǐng)先SAAS公司Salesforce花了150億美金收購了知名BI公司Tableau。
一家云計(jì)算公司為什么要投入如此多的資金去收購數(shù)據(jù)可視化公司,僅僅是為了提升數(shù)據(jù)分析和展示的能力,從而為企業(yè)提供更多的服務(wù)么?另外,傳統(tǒng)的BI廠商和云計(jì)算廠商結(jié)合后,是否會(huì)加速數(shù)據(jù)上云的過程,提升PAAS平臺(tái)的服務(wù)能力呢 ?未來,商業(yè)智能最核心的價(jià)值和競(jìng)爭(zhēng)力是什么 ?
帶著以上這些問題,首先還是來看下傳統(tǒng)BI的價(jià)值,傳統(tǒng)的商業(yè)智能主要是為更好地制訂戰(zhàn)略和決策提供良好的環(huán)境,為特定的應(yīng)用系統(tǒng)(如客戶關(guān)系管理CRM、供應(yīng)鏈管理SCM、企業(yè)資源計(jì)劃ERP)提供數(shù)據(jù)環(huán)境和決策分析支持。
當(dāng)面向特定應(yīng)用的特定戰(zhàn)略和決策問題,商業(yè)智能從數(shù)據(jù)準(zhǔn)備做起,建立或虛擬一個(gè)集成的數(shù)據(jù)環(huán)境。在集成的數(shù)據(jù)環(huán)境之上,利用科學(xué)的決策分析工具,通過數(shù)據(jù)分析、知識(shí)發(fā)現(xiàn)等過程,為戰(zhàn)略制訂和決策提供支持。整個(gè)過程中,集成的數(shù)據(jù)環(huán)境和決策分析工具是十分重要和不要缺少的。
那么,云計(jì)算時(shí)代的商業(yè)智能和傳統(tǒng)的BI相比有哪些不同或者說結(jié)合的方式呢?
一、基于云計(jì)算模式的BI
1.1 云計(jì)算與商業(yè)智能結(jié)合
BI其實(shí)就是一種可視化應(yīng)用和數(shù)據(jù)處理的能力。BI上云其實(shí)也就是利用云計(jì)算提供的海量平臺(tái)。BI與云計(jì)算結(jié)合,或者說把BI轉(zhuǎn)移到云計(jì)算平臺(tái)上,將很大程度提高BI的運(yùn)行速度、數(shù)據(jù)存儲(chǔ)能力、數(shù)據(jù)分析能力、決策判斷能力等?;A(chǔ)架構(gòu)對(duì)應(yīng)的IaaS平臺(tái)可以提供基礎(chǔ)設(shè)施,如虛擬化服務(wù)器,而PaaS云能夠提供海量的數(shù)據(jù)存儲(chǔ)空間,有助于企業(yè)存儲(chǔ)越來越多的信息和數(shù)據(jù)。
最上層的SaaS層面向終端提供服務(wù),按照不同的部署方式,企業(yè)的商業(yè)智能可選擇公有云、私有云和混合云幾種。
1.2 IaaS與虛擬服務(wù)器、虛擬存儲(chǔ)、數(shù)據(jù)倉庫
IaaS是指將IT基礎(chǔ)設(shè)施能力(如服務(wù)器、存儲(chǔ)、計(jì)算能力等)通過互聯(lián)網(wǎng)提供給用戶使用,并根據(jù)用戶對(duì)資源的實(shí)際使用量或占用量進(jìn)行計(jì)費(fèi)的一種服務(wù)。IaaS所提供的資源是富有彈性的,也就是說,當(dāng)用戶需要的時(shí)候能夠立即提供,而當(dāng)用戶不需要時(shí)候能自動(dòng)回收。
虛擬服務(wù)器能夠再一臺(tái)物理服務(wù)器上運(yùn)行多種虛擬服務(wù)器。而BI的最核心能力其實(shí)是位于PaaS層的數(shù)據(jù)倉庫。當(dāng)然,創(chuàng)建data warehouse直接在IaaS的虛擬服務(wù)器上就能完成。
BI最后給管理者提供的決策建議,其準(zhǔn)確度與數(shù)據(jù)倉庫的數(shù)據(jù)有很大的關(guān)系。高質(zhì)量的數(shù)據(jù)越多,推薦的結(jié)果也更加精準(zhǔn)。目前的線下服務(wù)器存儲(chǔ)能力難以負(fù)荷巨大的數(shù)據(jù)信息量。將DW遷移到云上,有助于更大信息量的存儲(chǔ)和分析。
1.3 SaaS與BI應(yīng)用
SaaS是一種局域互聯(lián)網(wǎng)提供軟件服務(wù)的應(yīng)用模式,它能夠以較低的成本為用戶提供軟件服務(wù),無需軟件的安裝、管理和支持等復(fù)雜的流程,使用戶能夠獲得比本地更好的體驗(yàn)。
從架構(gòu)成熟度上,BI在SaaS的實(shí)現(xiàn)以SaaS服務(wù)架構(gòu)的4級(jí)成熟度為前提。4級(jí)成熟度包括表現(xiàn)層、調(diào)度層、業(yè)務(wù)層與數(shù)據(jù)層。BI實(shí)質(zhì)上就是應(yīng)用而已,構(gòu)建在云上,顯示出極佳的效果。
表現(xiàn)層提供SaaS的展示方式,決定應(yīng)用能夠?qū)崿F(xiàn)的用戶體驗(yàn)水平。BI的服務(wù)對(duì)象主要是信息技術(shù)人員,而不是管理者,BI的可視化效果將影響管理者對(duì)決策信息的接受程度。
所謂的可視化技術(shù)就是通過計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像顯示等。展示層將BI分析得出的信息與結(jié)果用可視化形式表示出來,信息表達(dá)、解釋和評(píng)估的可視化有助于理解所獲得的信息并檢驗(yàn)信息的實(shí)用性。
調(diào)度層將客戶端發(fā)出的請(qǐng)求調(diào)度到何時(shí)的業(yè)務(wù)處理服務(wù)器上,提高SaaS的交付性能與資源利用率。業(yè)務(wù)層和數(shù)據(jù)層為BI應(yīng)用提供支持。
與云計(jì)算技術(shù)結(jié)合的BI自下而上可劃分為三個(gè)部分:最底層為基礎(chǔ)層,負(fù)責(zé)BI的數(shù)據(jù)倉庫、存儲(chǔ)處理計(jì)算等;中間層為平臺(tái)等,提供編程接口、邏輯實(shí)現(xiàn)等功能;最表層為實(shí)現(xiàn)層,根據(jù)用戶的個(gè)性化定制,把數(shù)據(jù)分析的結(jié)果呈現(xiàn)給用戶。
1.4 私有云、混合云和BI的結(jié)合
所謂的私有云,有點(diǎn)像云計(jì)算的基礎(chǔ)設(shè)施,使用虛擬化技術(shù),位于私有數(shù)據(jù)中心。私有云之所以更受企業(yè)認(rèn)可,是因?yàn)樗接性票裙性聘兴矫艿谋Wo(hù)性。雖然因此其共享性受到影響,但是由于BI里面分析的數(shù)據(jù)都是企業(yè)內(nèi)部數(shù)據(jù),采用私有云可以對(duì)數(shù)據(jù)進(jìn)行較好的保護(hù)。因此BI上到私有云上,不僅可以使數(shù)據(jù)得到一定的保護(hù),還可以享受云計(jì)算帶來的便利。
所謂的混合云,就是公有云和私有云的結(jié)合,是在云中存在兩種或者兩種以上云的類型?;旌显坪w了公有云和私有云的屬性,使得用戶的數(shù)據(jù)和應(yīng)用能夠根據(jù)不同需要在不同的云中遷移。它使企業(yè)既有自己的云計(jì)算環(huán)境,同時(shí)也能夠使用外部公共云計(jì)算的服務(wù)。兼顧了公有云的成本優(yōu)勢(shì)和私有云的安全性,受到企業(yè)的歡迎。
1.5 基于云計(jì)算的BI的優(yōu)點(diǎn)
BI上云主要有以下幾個(gè)優(yōu)點(diǎn):
- 提供更強(qiáng)大的數(shù)據(jù)存儲(chǔ)和管理能力:面對(duì)海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)倉庫模式已經(jīng)難以滿足當(dāng)今的需求?;谠朴?jì)算模式的商業(yè)智能可以通過虛擬服務(wù)器、虛擬存儲(chǔ)等服務(wù),提供給企業(yè)更強(qiáng)大的數(shù)據(jù)存儲(chǔ)和管理能力。
- 提供BI的實(shí)時(shí)性:企業(yè)的現(xiàn)狀,包括業(yè)務(wù)信息、客戶信息等不斷變化,要做出更為準(zhǔn)確有效的決策,這就對(duì)BI的實(shí)時(shí)性提出了更高的要求?;谠朴?jì)算模式的BI具有更快速、高效、穩(wěn)健的運(yùn)行性能,同時(shí)擴(kuò)展性極強(qiáng)。
- 硬件冗余自動(dòng)故障切換:云計(jì)算將BI所需的數(shù)據(jù)、應(yīng)用進(jìn)行分塊,建立在副本,保存在不同的服務(wù)器中,避免了物理硬件的損壞。
- 負(fù)載均衡:云計(jì)算BI能夠?qū)⒐ぷ骶鶆蚍峙涞讲煌?wù)器上,避免個(gè)別服務(wù)器工作負(fù)荷過大,讓BI性能發(fā)揮到極致。
- 個(gè)性化定制:將BI構(gòu)建在云上, SaaS將從展現(xiàn)層、業(yè)務(wù)層、數(shù)據(jù)層等方面,提供更人性化、更符合企業(yè)自身的可定制化配置和用戶可自定義功能。
- 成本低:基于云計(jì)算模式的BI更符合企業(yè)追求低成本的理念,有助于擴(kuò)大BI在中小企業(yè)中的發(fā)展力度,吸引更多的企業(yè)商家選擇BI。
1.6 應(yīng)用前景
云計(jì)算模式下的BI,企業(yè)可將大量數(shù)據(jù)存儲(chǔ)到云中,減少企業(yè)硬件成本,獲得彈性的存儲(chǔ)量大小。
在SaaS上,BI可提供不同的擴(kuò)展包,分為基礎(chǔ)包、專業(yè)包、企業(yè)包。企業(yè)可根據(jù)自身需要購買不同層次的擴(kuò)展包,這三個(gè)包給企業(yè)提供了更多的選擇。
BI所依賴的云,在現(xiàn)階段主要是以私有云為主。雖然公有云的成本更低,但是安全性還有待時(shí)間的考證。然而,隨著云安全性的不斷提升,可以預(yù)見,BI將逐步有私有云遷移到公有云,畢竟公有云成本更低。
隨著云計(jì)算技術(shù)的不斷完善,BI必將逐步遷移到該平臺(tái)上,不同類型的企業(yè)都會(huì)逐步嘗試采用這種低成本、高效率、可擴(kuò)展的模式,具有廣大的市場(chǎng)機(jī)會(huì)。
二、基于云端的數(shù)據(jù)處理能力
相比于傳統(tǒng)的OLTP和OLAP,云端的數(shù)據(jù)處理目前最核心的技術(shù)在于機(jī)器學(xué)習(xí),這也是為什么最近Apache Spark變得越來越流行,大有取代hadoop之勢(shì)。因?yàn)锳pache Spark除了性能更好以外,更重要的是融入了先進(jìn)的機(jī)器學(xué)習(xí)庫,可以建立聚類和預(yù)測(cè)模型,高效實(shí)現(xiàn)業(yè)務(wù)場(chǎng)景。
從業(yè)務(wù)層面,傳統(tǒng)的BI分析僅僅能夠展示現(xiàn)有的數(shù)據(jù)統(tǒng)計(jì)信息,沒有任何趨勢(shì)分析和決策建議,對(duì)管理層無法帶來實(shí)質(zhì)性的價(jià)值。而借助人工智能技術(shù),建立的數(shù)據(jù)模型具有前瞻性和參考價(jià)值,幫助管理者洞察業(yè)務(wù)關(guān)鍵信息。
標(biāo)準(zhǔn)BI和機(jī)器學(xué)習(xí)的結(jié)合模式如下圖所示:
從運(yùn)營(yíng)成本層面,本地建立機(jī)器學(xué)習(xí)模型成本非常的高,不僅需要昂貴的硬件設(shè)施,而且必須雇傭?qū)I(yè)的數(shù)據(jù)科學(xué)家。而數(shù)據(jù)上云以后,可以直接建設(shè)在第三方的IaaS和PaaS平臺(tái)上,調(diào)用第三方供應(yīng)商開發(fā)的機(jī)器學(xué)習(xí)模型也相對(duì)簡(jiǎn)單高效。當(dāng)然這個(gè)也帶來了接下來我們要討論的一個(gè)企業(yè)擔(dān)憂的問題 – 云端安全。
三、云端安全性探究
3.1 安全性隱患
云計(jì)算的安全性一直是備受關(guān)注的問題。云安全主要包括系統(tǒng)安全和數(shù)據(jù)安全。在云計(jì)算環(huán)境下,用戶對(duì)云計(jì)算數(shù)據(jù)中心的強(qiáng)依賴性,以及云計(jì)算服務(wù)對(duì)網(wǎng)絡(luò)條件的高要求,系統(tǒng)安全目前非常受重視。
虛擬存儲(chǔ)等服務(wù),實(shí)際上是將企業(yè)的內(nèi)部數(shù)據(jù)外包給服務(wù)商,使得數(shù)據(jù)的私密性成為了云計(jì)算服務(wù)的一個(gè)困擾。但是建立正確的安全模型、選擇正確的安全方法,那么在云計(jì)算平臺(tái)上可以實(shí)現(xiàn)對(duì)數(shù)據(jù)、系統(tǒng)安全性的保證。
3.2 安全解決方案
在基于云計(jì)算的BI中,針對(duì)安全問題,可以封裝一個(gè)安全層。云模式BI的安全模型構(gòu)建主要包括三個(gè)層面的安全性保障措施:基礎(chǔ)設(shè)施層、底部架構(gòu)層、數(shù)據(jù)信息層。
在基礎(chǔ)設(shè)施層上,根據(jù)安全防護(hù)需求,將云計(jì)算劃分成幾個(gè)安全域。各安全域之間通過防火墻進(jìn)行隔離。虛擬機(jī)接收到的包必須經(jīng)過虛擬網(wǎng)卡。這個(gè)虛擬網(wǎng)卡是通過 Host OS創(chuàng)建的,可對(duì)經(jīng)過它的包進(jìn)行過濾選擇。倘若某個(gè)包是發(fā)往不允許接收的端口,則虛擬網(wǎng)卡會(huì)丟棄這個(gè)包,以免端口收到攻擊。通過防火墻的隔離,確保安全域之間的數(shù)據(jù)傳輸?shù)陌踩院头€(wěn)定性。
由于云計(jì)算需要建立在互聯(lián)網(wǎng)上,因而對(duì)基礎(chǔ)網(wǎng)絡(luò)的安全性也有要求。云計(jì)算BI的平臺(tái)應(yīng)進(jìn)行統(tǒng)一IP地址規(guī)劃,對(duì)各部分再進(jìn)行IP地址和數(shù)據(jù)鏈路地址綁定。此外還應(yīng)建立異常流程監(jiān)控體系,以防網(wǎng)絡(luò)收到攻擊。
在底層架構(gòu)層上,主要針對(duì)的是IaaS服務(wù)。解決方法之一,就是將一系列虛擬機(jī)進(jìn)行劃分,在同一區(qū)域內(nèi)的虛擬機(jī)擁有一致的安全水平,相互之間可以安全交換信息,并與非該區(qū)域的虛擬機(jī)隔離,通過特定的安全策略與可信虛擬域外的虛擬機(jī)進(jìn)行通信。所有加入可信虛擬域內(nèi)的虛擬機(jī)都需要事先通過安全認(rèn)證。
在數(shù)據(jù)信息層里,可采取數(shù)據(jù)備份、身份認(rèn)證、權(quán)限管理、加密傳輸?shù)燃夹g(shù),實(shí)現(xiàn)對(duì)數(shù)據(jù)信息安全性和安全性的保護(hù)。為防止數(shù)據(jù)不慎損壞,需要對(duì)數(shù)據(jù)信息進(jìn)行備份與恢復(fù)。通過對(duì)用戶身份認(rèn)證,確保以身份進(jìn)行操作的操作者就是這個(gè)數(shù)字身份的合法擁有者,也就是保證操作者的物理身份與數(shù)字身份相對(duì)應(yīng)。
結(jié)語
回到我們開始談到的那則新聞,不難理解Salesfroce為什么要花大代價(jià)采購Tableau。主要還是因?yàn)镾alesforce擁有大量的用戶數(shù)據(jù)和云計(jì)算能力,而tableau擁有從數(shù)據(jù)倉庫到數(shù)據(jù)分析和報(bào)表完整的BI產(chǎn)品體系,兩者的結(jié)合可以增強(qiáng)彼此的產(chǎn)品和服務(wù),將BI部署到云上,產(chǎn)生更強(qiáng)的競(jìng)爭(zhēng)壁壘。
BI與云計(jì)算的集合是當(dāng)下熱門的問題?;谠朴?jì)算模式的BI,其本質(zhì)還是BI,云計(jì)算只是一個(gè)平臺(tái),它結(jié)合了兩者的優(yōu)勢(shì)。云計(jì)算的海量存儲(chǔ)、數(shù)據(jù)挖掘能力,為BI提供了良好的基礎(chǔ),同時(shí)其擁有的相比傳統(tǒng)模式更為低廉的收費(fèi),使企業(yè)減少成本,有助于吸引中小企業(yè)的加入。
BI的核心競(jìng)爭(zhēng)力在于機(jī)器學(xué)習(xí)等AI技術(shù)的植入。將BI與云計(jì)算結(jié)合,其強(qiáng)大的功能將為企業(yè)管理帶來前所未有的助力。
本文由@靜空一葉 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評(píng)論,等你發(fā)揮!