183.17.231.* 2020-05-28 10:48:16 |
數(shù)據(jù)分析工作雖然隱藏在業(yè)務(wù)系統(tǒng)背后,但是具有非常重要的作用,數(shù)據(jù)分析的結(jié)果對(duì)決策、業(yè)務(wù)發(fā)展有著舉足輕重的作用。隨著大數(shù)據(jù)技術(shù)的發(fā)展,數(shù)據(jù)挖掘、數(shù)據(jù)探索等專有名詞曝光度越來(lái)越高,今天我們就再來(lái)了解一下,大數(shù)據(jù)架構(gòu)的組成模塊都包含了哪些。
大數(shù)據(jù)架構(gòu)的組成模塊都包含了哪些
1、數(shù)據(jù)收集模塊
主要負(fù)責(zé)收集各種數(shù)據(jù)源的數(shù)據(jù),包括日志文件、網(wǎng)絡(luò)請(qǐng)求、數(shù)據(jù)庫(kù)、消息隊(duì)列等,并將這些數(shù)據(jù)轉(zhuǎn)換為文件或者消息向后傳遞。
2、數(shù)據(jù)轉(zhuǎn)存模塊
主要負(fù)責(zé)將數(shù)據(jù)定時(shí)傳遞到分布式存儲(chǔ)或者實(shí)時(shí)傳遞給下游的數(shù)據(jù)處理程序。
3、ETL模塊
主要負(fù)責(zé)數(shù)據(jù)的清洗、格式和內(nèi)容的處理和轉(zhuǎn)換、數(shù)據(jù)分級(jí)分揀、加載至數(shù)據(jù)倉(cāng)庫(kù)等。
4、數(shù)據(jù)倉(cāng)庫(kù)模塊
這是整個(gè)架構(gòu)的核心,數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)有組織的集中存儲(chǔ)的地方,負(fù)責(zé)數(shù)據(jù)的存取和管理。
5、元數(shù)據(jù)管理模塊
主要負(fù)責(zé)記錄和約束數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的含義和格式,控制著數(shù)據(jù)的生命周期和數(shù)據(jù)質(zhì)量。
6、分析引擎模塊
數(shù)據(jù)分析師交互多的模塊,主要負(fù)責(zé)執(zhí)行各種分析語(yǔ)句或代碼,完成各種分析任務(wù)。
7、作業(yè)管理與調(diào)度模塊
負(fù)責(zé)分析作業(yè)的管理和定時(shí)調(diào)度,包括作業(yè)的增刪改查、查看修改歷史、設(shè)置調(diào)度定時(shí)和執(zhí)行引擎等。
8、資源分配與調(diào)度模塊
主要負(fù)責(zé)在多作業(yè)同時(shí)運(yùn)行的場(chǎng)景下,**協(xié)調(diào)和分配集群的資源,使資源利用率大化。
大數(shù)據(jù)架構(gòu)的組成模塊.中琛魔方大數(shù)據(jù)分析平臺(tái)(www.zcmorefun.com)表示基于分布式技術(shù)構(gòu)建的大數(shù)據(jù)平臺(tái)能夠**降低數(shù)據(jù)存儲(chǔ)成本,提升數(shù)據(jù)分析處理效率,并具備海量數(shù)據(jù)、高并發(fā)場(chǎng)景的支撐能力,可大幅縮短數(shù)據(jù)查詢響應(yīng)時(shí)間,滿足企業(yè)各上層應(yīng)用的數(shù)據(jù)需求。 |