强化学习框架 Ray 在 K8s 上的自动伸缩设计与实现

为助力企业的智能化转型,才云不仅在深度学习的场景化应用上做了大量工作,也在学术界与世界一流大学开展强化学习和数据增强的研究,为企业广泛应用人工智能解决数据缺失难题,并分享云原生 + AI 的技术设计与实现。

2019-10-18

为什么才云能打进 500 强企业的财务部门?

很多 OCR 产品只是追求从 90% 到 90.01% 的炫技之作。而才云的成功之处,是正视了企业的现实情况,从平台级别实现一套通用的票据结构化识别流程,满足了企业在投入成本控制、自动化和软件长期价值上的综合收益。

2019-09-27

【深度】Kubernetes v1.16 最值得工程师关注的改动

昨天,Kubernetes 发布 2019 年的第三个新版本 1.16,才云第一时间对新版本重要更新做了精选整理,之后这篇文章被 CNCF 转发。经过一天的升级体验和对文档的细致阅读,才云现推出 Kubernetes v1.16 深度解读,以飨读者!

2019-09-23

云原生自动机器学习系统 Katib 的设计与实现

两年前,才云、谷歌、红帽等企业推出开源项目 Kubeflow,为企业基于容器和 Kubernetes 打造分布式机器学习平台,实现业务层面的分布式改造提供了机遇。作为该项目全球前三的贡献者,才云科技也一直致力于 Kubeflow 的技术推广和落地应用。

2019-08-29

从入门到大乘,才云开源内部 Kubernetes 学习路径

作为当前最流行的容器编排框架,Kubernetes 专为简化容器化部署而生。但随着云计算行业对 Kubernetes 人才需求的逐渐增加,越来越多人开始发现,学习 Kubernetes 并不是一件简单的事。

2019-07-25

Kubernetes Operator 测试面面观

软件测试是一门工程技术,更是一门艺术。维护良好、质量过硬的测试用例不仅能大幅提高开发者的工作幸福感,也是企业对外提供优质软件服务的重要基础。在这篇文章中,才云工程师 gaocegege 将分享团队在 Kubernetes Operator 测试方案上的一些心得。

2019-07-17

利用 kubebuilder 优化 Kubernetes Operator 开发体验

当前,Kubernetes 已经成为容器集群管理乃至云计算的事实标准。相比它曾经的竞争对手,如 Mesos、Docker Swarm 等,Kubernetes 最大的优势在于扩展性。而扩展性的一个重要体现,就是 Custom Resource 这一特性。在这篇文章中,才云科技工程师 gaocegege 将围绕 kubebuilder,介绍如何利用 K8s 的扩展性简化 Operator 开发过程。

2019-06-13

在 Kubernetes 中,如何动态配置本地存储?

Kubernetes 中使用节点的本地存储资源有 emptyDir、hostPath、Local PV 等几种方式。这之中,emptyDir 无法持久化数据,hostPath 方式需要手动管理卷的生命周期,运维压力大。因此在某些场景下,如果用户出于性能和运维成本考虑需要使用本地存储,Local PV 似乎是唯一选择。

2019-05-16

基于 Kubernetes 的 GPU 类型调度实现

3 月 27 日,ACM 宣布深度学习的三位缔造者——Yoshua Bengio、Yann LeCun 及 Geoffrey Hinton 获得了 2018 年度的图灵奖。与学术界相对应的,在工业界,人工智能大潮也正汹涌奔来。除了冲击人们的衣食住行医,人工智能也将成为企业转型的颠覆性力量,是企业抓住下一轮创新发展的重要机遇。

2019-05-07

结合谷歌十年容器实践,基于国内大型企业落地经验打造 的容器集群智能云平台。

立即体验