版本信息
产品名称 | 产品版本 | 发布日期 |
---|---|---|
数字原生引擎 EOS | V6.2.1 | 2024-04-03 |
更新说明
新增功能
磐石云操作系统 ESCL
- 支持飞腾S5000C新硬件。
- 支持NVIDIA Ampere架构GPU的虚拟化驱动。
- 支持cgroup v2。
- 提供了更全面的虚拟机数据和虚拟机异常感知方式。
- 增加aarch64架构虚拟机的CPU cache拓扑结构:完善了ACPI PPTT表,支持在虚机内显示CPU cache 拓扑数据。
微服务编排系统 EKS
- 对ingress-controller增加 validation admission webhook,防止ingress语法错误导致控制平面无法访问。
- 节点非优雅关机:节点由于断电等故障导致非正常关闭时,用户在确认节点处于不可恢复的情况下,可以通过给节点添加污点的方式,让有状态应用程序及时在正常运行的节点上重新启动,以免影响业务正常运行。
空中升级 OTA
- 支持上传龙芯架构的裸金属服务虚拟机镜像资源。
系统服务及应用程序
- 设备管理
- 支持NVIDIA A100/A800系列显卡创建计算加速型云主机(仅限直通模式)。
- 新增API:获取宿主机GPU信息、获取云主机挂载GPU信息。
- 设备管理
优化功能
云开放平台 ECP
- 升级GUI框架、组件库和颜色体系,以提升界面交互体验、功能性和视觉效果。
- 优化用户体验,包括统一图表颜色、改进加载逻辑、组件显示及运维视图搜索交互。
- 优化界面交互业务逻辑,提高系统运行效率。
身份与访问管理 IAM
- 优化LDAP用户登录过程,缩短身份认证时间。
自动化中心 ECAS
- 优化大规模场景下的导出环境信息的性能。
- 优化磁盘和Raid 卡信息获取机制,增强准确性。
分布式存储 ESS
- 优化特殊场景下的异常io处理机制,避免服务异常重启。
- 优化osd线程资源隔离和调度算法,提升20%以上cpu使用效率。
- 优化存储告警分组,提供更清晰的告警分类信息。
软件定义网络 ENS
- 支持网络节点分组,网络节点上的路由器可以在组间实现主备切换。
- 调整云平台网络资源的总配额限制,调整为:网络 5000、子网 10000、公网IP 65535、虚拟网卡 100000、路由器 1000、安全组 5000、安全组规则 50000。
微服务编排系统 EKS
- 将Kubernetes版本从1.20升级到1.28。
- 将containerd版本从1.5升级到1.7。
- 将etcd版本从3.4升级到3.5。
- 更新其他关键组件版本,包括CoreDNS、ingress-nginx、Flannel、Metric Server、k8s-keystone-auth、Helm、CephCSI等。
- 优化集群使用大量CRD场景导致的apiserver负载高的问题。
- 优化etcd日志频繁打印warning的问题。
- 优化使用shell启动命令的Pod被删除后存在僵尸进程的问题。
- 优化在大规模环境中获取pod偶现失败问题。
- 优化k8s-apiserver在缓存上执行GetList操作时的内存消耗。
- 将in-tree RBD Provisioner迁移到Ceph-CSI,将即将废弃的in-tree RBD切换到Ceph-CSI,便于后续升级。
- 优化kube-proxy在大规模集群中的性能。例如,当集群有1000个Endpoints时,不使用的iptables规则会保留一段时间,这个保留的最长时间为iptables规则的最大同步周期,因此不必每次同步都扫描旧规则。
- 优化Pod启动速度,例如并行拉取镜像、提高Kubelet默认API每秒查询限值等。
磐石云操作系统 ESCL
- 将内核基线升级至4.18-372。
- 将QEMU升级至6.2.0。
- 将Libvirt升级至8.0.0。
- 更好地支持Intel第三代CPU。
- 设备驱动更新包括:MegaRAID、qla2xxx、ice、ixgbe、sfc、mlnx、txgbe、ngbe。
系统服务及应用程序
- 主机高可用
- 优化平台升级时的高可用处理策略,消除升级时非预期触发的风险。
- 设备管理
- 优化了对kube-apiserver数据请求方式,以减轻etcd的压力。
- 优化了对Kubernetes新版本API的支持。
- 主机高可用
已修复问题
云开放平台 ECP
- 修复MFA登录后操作审计显示登录失败的问题。
- 修复在特定场景下,开启浏览器控制台会导致界面元素显示异常问题。
- 修复在特定场景下的页面跳转异常、提示信息错误的问题。
空中升级 OTA
- 修复一云多芯只有单架构资源包的场景下,ECAS解析失败的问题。
- 修复系统临时目录下数据包积累导致的空间不足问题。
- 修复删除云产品时,信息残留问题。
身份与访问管理 IAM
- 修复访问密钥过期时间时区不正确的问题。
- 修复已知安全漏洞问题。
自动化中心 ECAS
- 修复云产品虚机扩容后小概率出现hosts信息不全的问题。
分布式存储 ESS
- 修复升级过程中,特殊场景下的部分osd重启失败问题。
软件定义网络 ENS
- 修复使用ovs-tcpdump等命令特殊场景会导致MTU设置错误的问题。
- 修复特殊场景的NAT问题。
- 修复ovn-sb-relay副本数可能被错误设置问题。
微服务编排系统 EKS
- 修复了Pod删除时异常场景下未释放IP,导致Pod IP泄露的问题。
- 修复了扩容节点与控制节点kubelet配置不一致的问题。
- 修复了删除安全容器节点失败的问题,并解决了节点存在daemonset工作负载时,删除节点操作不符合预期的问题。
- 修复了核心组件安全漏洞CVE-2024-21626、CVE-2016-2183、CVE-2023-44487等。
- 修复了特定场景下EndpointSlices资源泄露导致服务访问错误的问题。
- 修复了仅剩一个API Server副本时,Kubernetes Service的Endpoint未被删除的问题,确保优雅终止时能够及时删除Endpoint。
磐石云操作系统 ESCL
- 修复RCU GP线程唤醒丢失的问题,该问题导致RCU宽限期无法推进,产生D状态进程。
- 解决chrony服务多份启动造成的时间不同步问题。
- 修复vhost的UAF造成内存数据破坏的问题。
- 修复了virtio-blk盘热迁移时,中断丢失导致虚拟机IO无法完成的问题。
- 解决了KVM TLB flush机制的TLB漏刷问题。
- 解决ipmi_watchdog驱动的bug,避免了读取/dev/watchdog时死循环的问题。
- 升级acpi_power_meter驱动,修复了node-exporter监控进程死锁的问题。
系统服务及应用程序
- 主机高可用
- 修复关闭重启疏散策略后节点有概率被重启的问题。
- 主机高可用