
1308次
2025-04-07
一、數據導入/預處理驗證階段
根據具體的應用背景和業務需求,各種數據源如網絡日志,物聯網,社會網絡及互聯網文本和文件等被按需加載到HDFS中待處理。在這個過程可能會由于不正確或不 ** ,存儲而導致的錯誤數據,對于這種情況,可采用以下方式進行測試:
1.輸入文件與源文件進行比對,保證數據的一致性;
2.根據數據需求來保證獲取數據的準確性;
3.驗證文件被正確的加載進HDFS,且被分割, ** 到不同的數據節點中。
二、MapReduce數據輸出驗證階段
當數據加載進行HDFS后, ** preduce開始對來自不同數據源的數據進行處理。在這個過程中可能會出現 ** preduce處理過程中的編碼問題,如在單一節點上運行正確,在多個節點上運行不正確的問題,包括不正確的聚合,節點配置,輸出格式等。針對于這個階段的問題,可采用以下驗證手段:
1.驗證梳理數據處理正常完成,輸出文件正常得到;
2.在單個節點上驗證大數據的業務邏輯,進
而在多節點上進行相同驗證;
3.驗證 ** preduce處理過程的key/value對是否正確生產;
4.在reduce過程結束后驗證數據的聚 ** 并是否正確;
5.通過源文件驗證輸出數據來保證數據處理正確完成;
6.按照大數據業務所需,驗證輸出數據文件格式是否符合要求。
三、驗證大數據ETL到數據倉庫
當 ** preduce過程結束后,產生的數據輸出文件將被按需移至數據倉庫或其它的事務型系統.在此過程中,可能會由于不正確地應用轉換規則,從HDFS中提取的數據不完全而帶來問題。針對于這個階段的問題可采用以下方法:
1.驗證轉換規則是否正確應用;
2.通過比較目標表數據和HDFS文件數據來驗證是否有數據損壞;
3.驗證目標系統數據加載是否成功;
4.驗證目標系統的數據完整性。
上述就是為你介紹的有關大數據功能性測試包含哪些內容的內容,對此你還有什么不了解的,歡迎前來咨詢我們網站,我們會有專業的人士為你講解。
關鍵詞: 功能性驗證報告 購物袋生物降解檢測 除病毒測試 一次性用品生物降解能力檢測 中藥材檢測報告 毒害物質檢測報告
編輯精選內容:
掃碼添加史工 掃碼添加嚴工

掃碼添加史工 掃碼添加嚴工
聯系人:史工18928790749、嚴工
聯系電話:19924323595、020-82118202、020-31608627
地址:廣州市黃埔區攬月路3號F棟316(總部)廣州市黃埔區科學城尖塔山路1號(動物中心)



