分布式任务调度平台 - 项目负责人
基于Kubernetes和Knative构建的自研分布式任务调度平台,通过资源统一调度、函数级环境隔离与动态污点标签机制,在公司内首创实现Windows/Linux异构环境下高并发任务的资源分配调度与跨项目数据安全隔离。
主要内容:
- 借用Kubernetes的资源编排能力,将Windows机器抽象为可调度的计算资源。
- 自研Windows Agent,利用virtual-kubelet框架和gRPC长链接,解决Kubernetes集群与Windows机器的通信问题,同时负责Windows机器上NAS、云盘各类数据盘的挂载、卸载生命周期。
- 自定义资源Function对函数进行描述,底层使用knative-serving管理函数实例
- 函数调用任务以CloudEvent规范传递到Windows机器并执行。
多集群管理平台 - 项目负责人
基于Karmada进行了二次研发,是一个开放、多云、多集群的Kubernetes编排系统,为业务跨集群管理服务带来诸多价值。
主要内容:
- 基于Karmada已有的框架,自研了多个Controller实现了关键的Global级别服务发现。
- 设计并完成跨集群CronJob分发方案的实现,解决了多个项目使用卡点。
- 完成与私有容器云平台的适配,支持多租户资源隔离,完成整体性能优化,平均性能提升效果超58%,单资源调谐分发时延当前均控制在毫秒级别。
私有容器云平台 - 主程
平台经历了三次版本变革,通过对Kubernetes的二次开发以及各类Controller的开发,完成与公司内部各类运维系统的打通以及客制化需求。
主要内容:
- 设计并开发ingress-controller,对接公司内部物理负载均衡。
- 设计并开发gateway-controller,对接公司云七层负载均衡。
- 设计并开发istio-manager,增加多租户支持,减轻istio资源管理负担,支持集群内证书自动更新等功能。