智能算力 Release Notes¶
本页列出智能算力各版本的 Release Notes,便于您了解各版本的演进路径和特性变化。
Note
标记为 [Beta] 的功能更新,在使用时请多注意,如遇问题请及时反馈。
2024-08-31¶
v0.8.0¶
功能¶
- [Beta] 新增 支持
Notebook运行中时,手工保存为镜像(依赖镜像仓库模块)。 - [Beta] 新增 支持
Notebook关闭时自动保存为镜像(依赖镜像仓库模块)。 - 新增 支持
Notebook镜像通过表单选择镜像仓库内的私有镜像。 - 新增 支持
Notebook配置 数据输入、数据输出,可直接关联数据集。 - 新增 支持
Notebook配置以Root身份启动。 - 新增 支持
训练任务配置 数据输入、数据输出,可直接关联数据集。 - [Beta] 新增 支持
训练任务支持配置 断点续训,自动检测任务故障后自动修复。 - 新增 支持
训练任务镜像通过表单选择镜像仓库内的私有镜像。 - 新增 支持
训练任务详情增加展示任务参数信息。 - 新增
环境管理可查询预热进度,并支持快速调试入口。 - 新增 支持
推理任务详情增加服务调用监控。 - 新增
baize-notebook基础镜像升级到 v0.8.0。
2024-07-31¶
v0.7.0¶
功能¶
- 新增 支持
数据集创建数据集后可查询预热进度,并支持快速调试入口。 - 新增 支持
训练任务创建MxNet单机和分布式任务。 - 新增 支持
训练任务创建MPI分布式任务。 - 新增 支持
训练任务支持默认镜像,统一使用基础镜像。 - 新增 支持
训练任务启动命令可直接配置启动脚本。 - 新增 支持
训练任务运行参数指定工作目录位置。 - 新增 支持
推理任务详情展示API调用示例文档。 - 优化
环境管理列表展示环境有的包管理器及Python版本。
2024-07-10¶
v0.6.1¶
修复¶
- 修复 创建推理服务时,推理框架选择使用
Triton,托管引擎缺少vLLM选项。
2024-06-30¶
v0.6.0¶
功能¶
- 新增 支持 创建
Code类型的Notebook,提供原生VS Code开发体验。 - 新增 支持 快速复制
Notebook。 - 新增 支持 在选择工作集群时,展示集群的状态信息,当失联或离线时不可选择。
- 新增 支持 创建推理服务时,使用
vLLM作为推理引擎,暴露原生vLLM能力。 - 新增 支持 创建推理服务时,
vLLM支持配置Lora推理参数。 - 优化 创建
Notebook时,队列优先级默认值调整为高。
修复¶
- 修复
Tensorboard最小资源限制,避免因资源不足导致Tensorboard启动失败。 - 修复 优化任务状态中文描述,避免因状态描述不清晰导致的误解。
2024-05-30¶
v0.5.0¶
功能¶
- 新增 支持
baizectl创建任务时同时增加Tensorboard分析看板。 - 新增 支持
Job绑定环境管理中创建的自定义环境。 - 新增 优化
环境管理中进行自定义环境配置更新、优化Python版本选择器等。 - 新增 支持
推理服务详情,查看模型运行时的资源监控看板。 - 新增 支持
推理服务绑定环境管理中创建的自定义环境。
修复¶
- 修复 环境管理中少数情况下
Python版本提示权限问题情况。 - 修复 推理服务在异常时不支持停止的问题。
2024-04-30¶
v0.4.0¶
功能¶
- 新增
Notebook支持本地 SSH 访问,适配多种开发工具,如Pycharm、VS Code等。 - 新增 升级
Notebook镜像,支持内置CLI工具baizectl,命令行提交和管理任务。 - 新增
Notebook增加亲和性调度策略配置。 - 新增 分布式训练任务,可界面化配置
SHM size。 - 新增 训练任务一键重启功能。
- 新增 模型训练任务支持自定义指定集群调度器。
- 新增 训练任务分析工具
Tensorboard支持,可在Notebook与训练任务中一键启动。 - 新增 队列配额编辑时,提示当前工作空间的共享资源配置。
- 新增 升级适配 Kueue 版本
v0.6.2。
修复¶
- 修复
NotebookCRD偶现配置同步异常问题。 - 修复
Notebook亲和性配置参数查询接口未返回。
2024-04-01¶
v0.3.0¶
功能¶
- 新增 发布
Notebook模块,支持Jupyter Notebook等开发工具。 - 新增 发布任务中心模块,支持多种主流开发框架
Pytorch、Tensorflow、Paddle任务训练。 - 新增 发布模型推理服务模块,支持快速部署
Model Serving,支持任意模型算法与大语言模型。 - 新增 发布数据管理模块,支持接入
S3、NFS、HTTP及Git等主流数据源,并支持自动数据预热。