开发、生产无缝衔接的 AI DevOps

Caicloud Clever 更新平台级 AI 工程化加速,切实助力企业 AI 生产落地

caicloud

精准化资源调度

得益于 Caicloud Compass 强大的资源管理能力(基于 Kubernetes 原生能力优化),Caicloud Clever 可以自动按需调度包括 GPU 在内的计算资源,用户可以在不关注物理资源的情况下托管训练任务、应用服务等。此外,Caicloud Clever 支持基于 Workspace 的资源隔离,用户可以针对不同的项目、团队定制 Workspace 资源。Caicloud Clever 可以按策略,最大化资源利用率。

caicloud

模块化开发集成

Caicloud Clever 提供多种预定义任务模板,支持多语言多框架的开发环境。Caicloud Clever 支持一键托管 Jupyter 等开发环境,Clever Jupyter 预置 TensorFlow、PyTorch、MXNet、Caffe 等多种框架 kernel,Caicloud Clever 亦支持 Python、Shell 等脚本开发及自定义开发环境。开发环境可与任务模块关联,用户可从任务模块直接进入对应开发环境。Caicloud Clever 细粒度引导式助力企业快速开启 AI 工程。

caicloud

仓储化数据运维

Caicloud Clever 提供数据仓库、模型仓库等集装式版本化数据管理。数据仓库数据集在任务模块中点击即可用于数据清洗或训练,模型仓库中可快速部署模型服务,并可在任务模块中按条件更新服务,以数据连接 AI 流程中各模块。Caicloud Clever 提供便捷的数据调用、共享方式,让数据以更有效的方式在 AI 模块中流动。

caicloud

可视化训练管理

Caicloud Clever 支持可视化创建 TensorFlow、PyTorch 等框架的分布式多卡集群训练任务,平台支持实时训练日志及 GPU 等资源实时监控。平台提供多维度任务总览,方便算法科学家、服务运维者、项目管理者从不同角度审视任务表状态。Caicloud Clever 使不同角色以更合适的角度把控任务进度。

caicloud

工程化 AI 全流程编排

用户可创建 AI 全流程从数据清洗、模型训练到模型服务等不同阶段的任务模块,工程师、科学家可在任务模块上进行开发,架构师、项目经理可自由编排 AI 模块至工程流图,快速将功能模块拼接成工程项目。Caicloud Clever 以工程流图连接模块、数据以及人,提高团队协作力及工程效率,加速 AI 工程化。

caicloud

自动化生产部署

用户可基于工程流图持续迭代开发,用户可在不同迭代发布不同版本的流水线,流水线按条件触发流图流程,实现 AI 工程从实验到生产的自动化部署。 Caicloud Clever 支持工程流图一键式发布为生产流水线,所见即所得,无缝衔接 AI 工程开发与生产落地。

结合谷歌十年容器实践,基于国内大型企业落地经验打造的容器集群智能云平台。

立即体验
立即咨询