構建DataOps數據運維框架需要以下技術:
云架構:必須使用基于云的基礎架構來支持資源管理、可擴展性和運營效率。
容器:容器在DevOps的實現中至關重要,在資源隔離和提供一致開發、測試、運維環境中的作用也至關重要。
實時和流處理:目前來看,實時和流處理在數據驅動平臺中變得越來越重要,它們應該是現代數據平臺中的“一等公民”。
多分析引擎:MapReduce是傳統的分布式處理框架,但Spark和TensorFlow等框架日常使用越來越廣泛,應該進行集成。
集成的應用程序和數據管理:應用程序和數據管理(包括生命周期管理、調度、監控、日志記錄支持)對于生產數據平臺至關重要。DevOps的常規實踐可應用于應用程序管理,但是數據管理及應用程序與數據之間的交互需要很多額外的工作。
多租戶和安全性:數據安全性可以說是數據項目中最重要的問題,如果數據無法得到保護,數據使用也就無從談起。該平臺應為每個人提供一個安全的環境,使每個人都可以使用這些數據并對每個操作進行授權、驗證和審核。
DevOps工具:該平臺應為數據科學家提供有效的工具,以分析數據并生成分析程序,為數據工程師提供大數據流水線的工具,并為其他人提供消費數據和結果的方法。
回答所涉及的環境:聯想天逸510S、Windows 10。
構建DataOps數據運維框架需要以下技術:
云架構:必須使用基于云的基礎架構來支持資源管理、可擴展性和運營效率。
容器:容器在DevOps的實現中至關重要,在資源隔離和提供一致開發、測試、運維環境中的作用也至關重要。
實時和流處理:目前來看,實時和流處理在數據驅動平臺中變得越來越重要,它們應該是現代數據平臺中的“一等公民”。
多分析引擎:MapReduce是傳統的分布式處理框架,但Spark和TensorFlow等框架日常使用越來越廣泛,應該進行集成。
集成的應用程序和數據管理:應用程序和數據管理(包括生命周期管理、調度、監控、日志記錄支持)對于生產數據平臺至關重要。DevOps的常規實踐可應用于應用程序管理,但是數據管理及應用程序與數據之間的交互需要很多額外的工作。
多租戶和安全性:數據安全性可以說是數據項目中最重要的問題,如果數據無法得到保護,數據使用也就無從談起。該平臺應為每個人提供一個安全的環境,使每個人都可以使用這些數據并對每個操作進行授權、驗證和審核。
DevOps工具:該平臺應為數據科學家提供有效的工具,以分析數據并生成分析程序,為數據工程師提供大數據流水線的工具,并為其他人提供消費數據和結果的方法。
回答所涉及的環境:聯想天逸510S、Windows 10。