數據采集
數據采集是數據倉庫建設中(zhōng)最基礎的工(gōng)作,負責将散落在各個數據孤島的數據整合到統一(yī)數據倉庫平台中(zhōng)。數據采集不隻需要能夠從多種不同類型的數據系統采集數據,還要考慮數據采集的效率,通過全量和增量采集相結合的手段完成采集工(gōng)作。在采集的過程中(zhōng),還不能對在線系統産生(shēng)影響。
|
數據生(shēng)産鏈路監控
就像工(gōng)業流水線一(yī)樣,數據倉庫的數據加工(gōng)過程是一(yī)個數據生(shēng)産的有向無環圖。如何讓數據有序的按照數據模型設計的邏輯一(yī)步一(yī)步被加工(gōng)出來,保障數據上下(xià)遊依賴的正确性,在發現問題時能夠提醒開(kāi)發人員(yuán)及時處理,是一(yī)個艱苦而細緻的工(gōng)作,也是數據倉庫建設過程中(zhōng)最主要的工(gōng)作。
|
數據質量管理
數據質量是數據倉庫的生(shēng)命線,是數據倉庫建設中(zhōng)的重中(zhōng)之重。在數據生(shēng)産的整個鏈條中(zhōng),需要能夠根據數據特征制定不同的數據質量監控規則,随時監控數據的産出質量,并制定出相應的控制手段,保障不讓有質量問題的數據影響業務的決策。
|
數據采集
數據采集是數據倉庫建設中(zhōng)最基礎的工(gōng)作,負責将散落在各個數據孤島的數據整合到統一(yī)數據倉庫平台中(zhōng)。數據采集不隻需要能夠從多種不同類型的數據系統采集數據,還要考慮數據采集的效率,通過全量和增量采集相結合的手段完成采集工(gōng)作。在采集的過程中(zhōng),還不能對在線系統産生(shēng)影響。
|
數據生(shēng)産鏈路監控
就像工(gōng)業流水線一(yī)樣,數據倉庫的數據加工(gōng)過程是一(yī)個數據生(shēng)産的有向無環圖。如何讓數據有序的按照數據模型設計的邏輯一(yī)步一(yī)步被加工(gōng)出來,保障數據上下(xià)遊依賴的正确性,在發現問題時能夠提醒開(kāi)發人員(yuán)及時處理,是一(yī)個艱苦而細緻的工(gōng)作,也是數據倉庫建設過程中(zhōng)最主要的工(gōng)作。
|
數據質量管理
數據質量是數據倉庫的生(shēng)命線,是數據倉庫建設中(zhōng)的重中(zhōng)之重。在數據生(shēng)産的整個鏈條中(zhōng),需要能夠根據數據特征制定不同的數據質量監控規則,随時監控數據的産出質量,并制定出相應的控制手段,保障不讓有質量問題的數據影響業務的決策。
|