183.17.229.* 2020-09-28 13:17:23 |
企業要開展大數據相關業務,首先就需要基于自身的需求,來設計搭建數據系統平臺。而大數據系統平臺的搭建,需要基于實際需求,來進行系統架構規劃。今天我們就從大數據平臺開發的角度,來對大數據系統架構模塊做一個簡單的介紹。
在實際的業務場景當中,每個公司的需求是不一樣的,因此大數據平臺開發需要選擇適合自己的技術框架,在實際工作當中,這部分工作往往有兼具經驗和實力的大數據工程師或者大數據架構師來完成。
通常來說,一個大數據系統架構通用的模塊包括——
數據收集模塊:主要負責收集各種數據源的數據,包括日志文件、網絡請求、數據庫、消息隊列等,并將這些數據轉換為文件或者消息向后傳遞。
數據轉存模塊:主要負責將數據定時傳遞到分布式存儲或者實時傳遞給下游的數據處理程序。
ETL模塊:主要負責數據的清洗、格式和內容的處理和轉換、數據分級分揀、加載至數據倉庫等。
數據倉庫模塊:這是整個架構的核心,數據倉庫是數據有組織的集中存儲的地方,負責數據的存取和管理。
元數據管理模塊:主要負責記錄和約束數據倉庫中數據的含義和格式,控制著數據的生命周期和數據質量。
分析引擎模塊:數據分析師交互最多的模塊,主要負責執行各種分析語句或代碼,完成各種分析任務。
作業管理與調度模塊:負責分析作業的管理和定時調度,包括作業的增刪改查、查看修改歷史、設置調度定時和執行引擎等。
資源分配與調度模塊:主要負責在多作業同時運行的場景下,**協調和分配集群的資源,使資源利用率**化。
當然,這些模塊并不一定每個企業的架構都是如此,始終還是需要基于實際的需求來進行技術選型。
大數據系統架構模塊解析.中琛魔方大數據分析平臺(www.zcmorefun.com)表示大數據系統架構工作,對專業技術的深度和廣度,以及項目實操經驗,都有相應的要求,大數據架構師,也是做開發方向的**技術崗位。 |