云原生自动机器学习系统 Katib 的设计与实现

两年前,才云、谷歌、红帽等企业推出开源项目 Kubeflow,为企业基于容器和 Kubernetes 打造分布式机器学习平台,实现业务层面的分布式改造提供了机遇。作为该项目全球前三的贡献者,才云科技也一直致力于 Kubeflow 的技术推广和落地应用。

2019-08-29

从入门到大乘,才云开源内部 Kubernetes 学习路径

作为当前最流行的容器编排框架,Kubernetes 专为简化容器化部署而生。但随着云计算行业对 Kubernetes 人才需求的逐渐增加,越来越多人开始发现,学习 Kubernetes 并不是一件简单的事。

2019-07-25

Kubernetes Operator 测试面面观

软件测试是一门工程技术,更是一门艺术。维护良好、质量过硬的测试用例不仅能大幅提高开发者的工作幸福感,也是企业对外提供优质软件服务的重要基础。在这篇文章中,才云工程师 gaocegege 将分享团队在 Kubernetes Operator 测试方案上的一些心得。

2019-07-17

Kubernetes v1.15 重磅发布 | 新版本亮点 & 紧急升级说明

美国时间 6 月 19 日,Kubernetes 迎来了 2019 年的第二个新版本 1.15。作为 CNCF 官方合作伙伴,才云科技在第一时间整理了 Kubernetes v1.15 的亮点内容,为大家详细介绍此版本的主要功能。

2019-06-20

利用 kubebuilder 优化 Kubernetes Operator 开发体验

当前,Kubernetes 已经成为容器集群管理乃至云计算的事实标准。相比它曾经的竞争对手,如 Mesos、Docker Swarm 等,Kubernetes 最大的优势在于扩展性。而扩展性的一个重要体现,就是 Custom Resource 这一特性。在这篇文章中,才云科技工程师 gaocegege 将围绕 kubebuilder,介绍如何利用 K8s 的扩展性简化 Operator 开发过程。

2019-06-13

在 Kubernetes 中,如何动态配置本地存储?

Kubernetes 中使用节点的本地存储资源有 emptyDir、hostPath、Local PV 等几种方式。这之中,emptyDir 无法持久化数据,hostPath 方式需要手动管理卷的生命周期,运维压力大。因此在某些场景下,如果用户出于性能和运维成本考虑需要使用本地存储,Local PV 似乎是唯一选择。

2019-05-16

基于 Kubernetes 的 GPU 类型调度实现

3 月 27 日,ACM 宣布深度学习的三位缔造者——Yoshua Bengio、Yann LeCun 及 Geoffrey Hinton 获得了 2018 年度的图灵奖。与学术界相对应的,在工业界,人工智能大潮也正汹涌奔来。除了冲击人们的衣食住行医,人工智能也将成为企业转型的颠覆性力量,是企业抓住下一轮创新发展的重要机遇。

2019-05-07

当我们在谈论机器学习平台时,我们在谈什么

近年来,AI 领域屡现突破性进展,吸引了全球企业争相采用 AI 技术来培育新增长、形成新动能、加快产业与科技的创新融合。在这个背景下,AI 人才开始供不应求,AI 产品迎来爆发。然而新技术总有一定壁垒,机器学习不仅需要算法科学家构建新模型,工程师应用新模型,还需要工程师合力建设机器学习平台。而在应用机器学习的企业和团队中,建设机器学习平台正是重要一环。

2019-03-27

Kubernetes v1.14 重磅发布 | 新版本四大亮点 & 紧急升级说明

美国时间 3 月 25 日,Kubernetes 迎来了 2019 年的第一个新版本 1.14。与此前发布的各版本Kubernetes 相比,本版本中的增强功能更趋于稳定。这对那些把 Kubernetes 视为重要战略支撑的企业和运营商而言,是个重要里程碑。Kubernetes v1.14 由 31 项功能强化构成:10 个功能已经稳定,12 个功能进入 Beta,7 个全新功能。这次更新延续了以往的主题——可扩展性,且能支持 Kubernetes 上的更多工作负载,其中三个主要功能转向一般可用性,一个重要安全功能转向 Beta。

2019-03-26

结合谷歌十年容器实践,基于国内大型企业落地经验打造 的容器集群智能云平台。

立即体验
立即咨询