首頁(yè) > 新聞 > 專(zhuān)家觀點(diǎn) >

數(shù)據(jù)寶庫(kù)

2012-08-21 16:39:48   作者:Teradata高級(jí)解決方案顧問(wèn) 李向前   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  每天,我們都在創(chuàng)建難以估算的海量數(shù)據(jù),F(xiàn)在全球90%的數(shù)據(jù)都是過(guò)去兩年間產(chǎn)生的,這些數(shù)據(jù)來(lái)源廣泛,包括氣象信息收集傳感器、社交媒體內(nèi)容、在線數(shù)碼照片和視頻、在線交易記錄及手機(jī)GPS信號(hào)等。這種類(lèi)型的數(shù)據(jù)被稱(chēng)為多結(jié)構(gòu)化數(shù)據(jù),也就是通常所指的大數(shù)據(jù)。值得注意的是,大數(shù)據(jù)可以根據(jù)其結(jié)構(gòu)的復(fù)雜性和多樣性來(lái)定義。
 
  每天,各種網(wǎng)站都能產(chǎn)生大量TB數(shù)量級(jí)復(fù)雜的原始數(shù)據(jù),收集了消費(fèi)者的瀏覽及購(gòu)買(mǎi)習(xí)慣,因此也被稱(chēng)為交互數(shù)據(jù)。在分析準(zhǔn)備中,將這些網(wǎng)絡(luò)日志轉(zhuǎn)化和提煉,將最終分析出客戶偏好。通過(guò)整合及應(yīng)用數(shù)量龐大、類(lèi)型復(fù)雜的數(shù)據(jù),將實(shí)現(xiàn)客戶信息的深度洞察。此外,通過(guò)整合客戶的交易信息數(shù)據(jù),將獲得支持營(yíng)銷(xiāo)活動(dòng)的觀點(diǎn),確保在正確的時(shí)間,將適當(dāng)?shù)拇黉N(xiāo)信息提供給需要的消費(fèi)者。
 
  顯而易見(jiàn),數(shù)據(jù)的絕大部分是多結(jié)構(gòu)化數(shù)據(jù),或者是多種不同格式的數(shù)據(jù)。我們大量的工作時(shí)間用于閱讀或者回復(fù)郵件,撰寫(xiě)報(bào)告或文章,進(jìn)行交談,收聽(tīng)直播或者錄音資料。顯然,這些都是產(chǎn)生多結(jié)構(gòu)化數(shù)據(jù)的情形。這種數(shù)據(jù)不僅帶來(lái)挑戰(zhàn),同時(shí)也是通過(guò)新興類(lèi)型數(shù)據(jù)形成洞察力的機(jī)會(huì),確保業(yè)務(wù)更加靈活,解決過(guò)去和未來(lái)存在的挑戰(zhàn)。
 
  此外,多結(jié)構(gòu)化數(shù)據(jù)環(huán)境將帶來(lái)新的挑戰(zhàn)和機(jī)遇,利于分析、管理和控制現(xiàn)有系統(tǒng)和新渠道產(chǎn)生的大容量、高增長(zhǎng)、易變化且復(fù)雜的數(shù)據(jù)信息。多年以來(lái),企業(yè)已經(jīng)身處這種環(huán)境,應(yīng)對(duì)來(lái)自網(wǎng)絡(luò)互動(dòng)、移動(dòng)設(shè)備、社會(huì)媒體、機(jī)器數(shù)據(jù)及其他來(lái)源的新型信息。
 
  目前,只有最大規(guī)模及專(zhuān)注于數(shù)據(jù)分析的公司擁有時(shí)間、資源和工具進(jìn)行大數(shù)據(jù)分析。但是,更多的公司將能夠順利應(yīng)用可擔(dān)負(fù)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),從新信息源中獲取珍貴的戰(zhàn)略性觀點(diǎn),以前所未有的速度支持業(yè)務(wù)創(chuàng)新。
 
 海量數(shù)據(jù)帶來(lái)極致痛苦?
 
  隨著數(shù)據(jù)源呈現(xiàn)指數(shù)級(jí)增長(zhǎng),信息的數(shù)量及復(fù)雜程度快速擴(kuò)大,從海量數(shù)據(jù)中提取信息的能力正快速成為戰(zhàn)略性的強(qiáng)制要求。2011年4月,Gartner集團(tuán)發(fā)布了《大數(shù)據(jù)僅僅是海量信息管理的開(kāi)端》報(bào)告。報(bào)告稱(chēng):“對(duì)大數(shù)據(jù)的關(guān)注展現(xiàn)了最主要的挑戰(zhàn),這些挑戰(zhàn)將重構(gòu)現(xiàn)有的信息管理實(shí)踐和技術(shù)。管理海量數(shù)據(jù)的能力將成為企業(yè)的核心競(jìng)爭(zhēng)力,確保企業(yè)能夠持續(xù)使用新型信息(文本、社交網(wǎng)絡(luò)、環(huán)境)發(fā)掘支撐業(yè)務(wù)決策的模式(基于模式的戰(zhàn)略)。”
 
釋放創(chuàng)新能力
 
  為站在不斷發(fā)展的信息浪潮之尖,企業(yè)必須尋求大數(shù)據(jù)分析方案,擴(kuò)展從集成數(shù)據(jù)倉(cāng)庫(kù)獲得的知識(shí)資產(chǎn)。但是,大部分集成數(shù)據(jù)倉(cāng)庫(kù)尚未納入來(lái)自網(wǎng)絡(luò)日志及社交媒體高達(dá)80%的多結(jié)構(gòu)化數(shù)據(jù)。
 
  其實(shí),大數(shù)據(jù)的挖掘和分析并非僅應(yīng)用在營(yíng)銷(xiāo)領(lǐng)域。部分高精度加工企業(yè),如半導(dǎo)體和醫(yī)藥領(lǐng)域企業(yè),也正面臨著海量數(shù)據(jù)壓力,期望通過(guò)存儲(chǔ)并分析這種數(shù)據(jù),制定出更佳的業(yè)務(wù)決策。而且,更大的期待是通過(guò)理解運(yùn)營(yíng)和制造中的問(wèn)題,以及提供更好的用戶體驗(yàn)。通過(guò)收集、存儲(chǔ)和分析所有的多結(jié)構(gòu)化數(shù)據(jù),將有助于輕松實(shí)現(xiàn)這些宏偉愿望。
分享到: 收藏

專(zhuān)題