概述

English | 简体中文

KDP(Kubernetes Data Platform) 提供了一个基于 Kubernetes 的现代化混合云原生数据平台。它能够利用 Kubernetes 的云原生能力来有效地管理数据平台。

总体架构

基于 OAM(Open Application Model) 标准统一应用发布和管理流程，打通各组件之间的配置管理，实现 IaC(Infra as Code)
在大数据组件的 Operator 和 Helm Chart 之上创建了统一抽象层，实现发布和运维的标准化和自动化
对大数据核心组件进行代码级别的改造以支持 K8s 资源调度，网络及存储体系，并将这些组件的最新版本进行统一集成
利用 K8s 的命名空间实现多租户管理，资源隔离，实现按需动态资源配置，并实现了资源使用统计计费组件（企业版）
扩展并强化了多租户环境下的安全认证及鉴权机制，采用统一的 Kerberos 安全认证和基于 Ranger 的授权机制（企业版）
对计算引擎在云原生形态下的性能进行优化，例如：批流作业统一的 Volcano 调度，解决了 Spark on HDFS 的 Data Locality 问题（企业版）

KDP基础设施层提供了一套基于 OAM(Open Application Model) 的标准集成流程，将开源大数据组件与统一系统服务对接，形成标准化配置文件。在K8s配置的基础上提供封装，简化大数据组件的配置流程，标准化组件与系统服务及其它组件之间的对接机制。主要包括：

KDP基础设施层提供了一套应用发布服务，负责大数据组件从配置文件到K8s集群的发布，更新，运维，升级操作。和通用PaaS平台最大的区别在于对大数据负载的支持，租户体系，用户管理以及其资源管理（后三点为企业版特性）的集成。主要包括：

KDP提供大数据组件以及其执行的工作负载日志，性能/稳定性的指标监控和报警，计费以及审计功能（企业版特性）。和通用PaaS平台最大的区别在于其支持：run-to-finish任务、二级调度任务和数据层面的可观测性洞察。主要包括：

KDP为计算引擎组件提供云原生的调度机制支持，以提升资源使用率与运行效率。在通用K8s调度机制基础上实现二级调度，能更好的支持大数据类型负载的效率和SLA要求。主要包括：

组件	说明
HDFS	* 扩展了开源社区的 Helm Chart * 支持了动态PV、容器网络及组件上下文配置管理
Hive	* 扩展开源代码支持 Hive SQL 以 Spark 作业方式运行 * 支持在 Hue 或者 Beeline 客户端运行 Hive SQL * Hive Table 可以存储在 HDFS 或者对象存储中
Spark	* 扩展了开源社区的 Spark Operator * 通过自研 API 或者 JupyterLab 运行 Spark 作业 * 扩展开源代码进行性能优化：Data Locality in HDFS、Sticky Sessions
Kafka	* 扩展了开源社区的 Strimzi Kafka Operator * 引入了 Kafka 集群管理界面
Flink	* 扩展了开源社区的 Flink Operator * Flink 作业与 Spark 作业使用统一的调度
...	...