为大数据平台的运维团队提供对整个集群的统筹管理与监控能力,包括对集群的安装、配置、启动停止管理、监控健康状态仪表盘、收集监控数据、预警框架实现通知预警
针对企业数据来源多、类型杂、体量大的特点,提供海量数据存储能力,包括存储硬件错误检测和快速自动恢复、流式数据访问、大规模数据集、简单一致性模型和移动计算能力
离线批处理: 分布式离线批处理实现数据清洗、转换映射、归一化等预处理动作。
实时计算: 分布式实时计算实现对数据进行实时业务逻辑处理并输出结果。
机器学习: 分布式技术对全量数据进行高效的模型训练,为预测、预警和分析类应用提供底层支持。
多维分析: 利用ERP、CRM等系统产生的原始数据进行分析或产出报表来辅助企业决策。
用户管理: 对多用户提供数据授权和服务访问授权分配服务。
数据隔离与访问授权: 对不同业务和团队数据进行数据存储空间隔离和授权机制服务。
访问控制: 对WEB UI控制台和Restful API接口等资源进行访问控制。
集群服务安全: 构建集群服务间认证通信方案以保障集群间消息通信和数据传输安全可信。