解決方案使用不同類型的組件。企業(yè)數(shù)據(jù)面臨的挑戰(zhàn)是它廣泛分布在各種不同的技術(shù)和數(shù)據(jù)平臺(tái)上。例如,數(shù)字化零售、電信業(yè)及社交媒體使用結(jié)構(gòu)化數(shù)據(jù),其表現(xiàn)形式相似;而企業(yè)數(shù)據(jù)則分布在主機(jī)、ETL(提取、轉(zhuǎn)換和加載)工具、虛擬層、關(guān)系數(shù)據(jù)庫(kù)、商業(yè)智能(BI)數(shù)據(jù)庫(kù)、交易數(shù)據(jù)庫(kù)以及數(shù)百種其它組件中,這些技術(shù)在過(guò)去30年中已不斷發(fā)展。更糟糕的是,每種應(yīng)用程序使用不同的數(shù)據(jù)模型,導(dǎo)致數(shù)據(jù)與其相關(guān)技術(shù)平臺(tái)整合越來(lái)越復(fù)雜,因此,利用當(dāng)前大數(shù)據(jù)工具訪問(wèn)企業(yè)數(shù)據(jù),難以創(chuàng)造直接的價(jià)值。
這就是企業(yè)大部分業(yè)務(wù)問(wèn)題與大數(shù)據(jù)無(wú)關(guān)的原因。這些業(yè)務(wù)問(wèn)題實(shí)際上是分布式數(shù)據(jù)問(wèn)題:在這種模型下,信息、數(shù)據(jù)、價(jià)值和分析廣泛分布在不同的位置、技術(shù)平臺(tái)和數(shù)據(jù)源內(nèi)。但我們?nèi)岳^續(xù)使用與以往相同的集中式模型來(lái)解決這一日趨嚴(yán)重的分布式問(wèn)題。當(dāng)用戶能夠通過(guò)常見(jiàn)的界面外觀穩(wěn)定地訪問(wèn)數(shù)據(jù)時(shí),這些集中式模型能夠發(fā)揮很大的作用,這在社交媒體、數(shù)字化零售等行業(yè)新的成功案例中屢見(jiàn)不鮮。但集中式模型卻無(wú)法解決銀行、保險(xiǎn)、醫(yī)療行業(yè)及其它廣泛的業(yè)務(wù)問(wèn)題。
Standish梅隆資產(chǎn)管理公司近期更新大型數(shù)據(jù)項(xiàng)目成功案例調(diào)研報(bào)告。更新內(nèi)容顯示,2003至2012十年間人工成本至少達(dá)到1,000萬(wàn)美元的3,555個(gè)大型數(shù)據(jù)項(xiàng)目中,只有6.4%的項(xiàng)目順利完成。這正是企業(yè)未能高效管理分布式數(shù)據(jù)源及其相關(guān)技術(shù)所造成的后果。我們?nèi)孕柽\(yùn)用大數(shù)據(jù)技術(shù)才能克服這些困難。
目前,企業(yè)實(shí)現(xiàn)大數(shù)據(jù)價(jià)值需對(duì)多種不同數(shù)據(jù)及功能體系進(jìn)行數(shù)據(jù)整合及標(biāo)準(zhǔn)化規(guī)劃。如不改變現(xiàn)有數(shù)據(jù)管理機(jī)制,那么企業(yè)解決方案采用越多的分布式組件,項(xiàng)目回報(bào)率越低。
大數(shù)據(jù)技術(shù)促進(jìn)深度分析及分析性能取得技術(shù)突破,其價(jià)值毋庸置疑。但這種價(jià)值卻被數(shù)據(jù)提取和/或整合成本破壞,導(dǎo)致價(jià)值/炒作的底線被輕易沖破。目前,市場(chǎng)在數(shù)據(jù)價(jià)值上多少存在一些分歧,其中一部分行業(yè)尚處于初創(chuàng)時(shí)期,可保持技術(shù)一致性,因此,這些行業(yè)可以暫時(shí)解決分布式數(shù)據(jù)的問(wèn)題。
由于技術(shù)孤島仍將持續(xù)存在,且數(shù)據(jù)仍保存在不同的位置,Gartner公司分析師Doug
Laney預(yù)計(jì)到2017年,90%的大數(shù)據(jù)項(xiàng)目仍無(wú)法發(fā)揮它們的作用。Doug最近總結(jié)到,雖然數(shù)據(jù)復(fù)雜性、企業(yè)內(nèi)外部數(shù)據(jù)的分布和離散度不斷提升,但也不會(huì)因?yàn)榇髷?shù)據(jù)技術(shù)作出的各種承諾而承認(rèn)系統(tǒng)及數(shù)據(jù)大規(guī)模整合項(xiàng)目的合理性,它們只是大數(shù)據(jù)價(jià)值的體現(xiàn)。
我們只有意識(shí)到大數(shù)據(jù)技術(shù)雖已占有一席之地,但仍受到分布式數(shù)據(jù)源的直接影響,才能盡早通過(guò)真正具有成本效益的途徑,根據(jù)數(shù)據(jù)復(fù)雜度和分布情況,充分利用數(shù)據(jù)價(jià)值。
大多數(shù)企業(yè)可靈活使用雙重?cái)?shù)據(jù)策略:運(yùn)用大數(shù)據(jù)技術(shù)對(duì)大量同類數(shù)據(jù)進(jìn)行深入分析及機(jī)會(huì)辨別;或運(yùn)用分布式數(shù)據(jù)應(yīng)對(duì)運(yùn)營(yíng)、風(fēng)險(xiǎn)、管理等復(fù)雜但已為人所了解的挑戰(zhàn)。人們將能夠接受這種雙重?cái)?shù)據(jù)管理策略,充分發(fā)現(xiàn)、挖掘并管理大數(shù)據(jù)技術(shù)的價(jià)值,并在行業(yè)內(nèi)實(shí)現(xiàn)不斷靈活創(chuàng)新。