平台架构

AI用户最佳工作模式

产品体系服务方式

算法算力智能中台融合多种开放的云计算和AI技术,平台支持各种主流的云计算和AI框架,为企业级用户提供私有云、

公有云及混合云的多形态AI产品和服务解决方案,帮助用户更灵活地选择与其业务战略相适应的智能云架构,快速实现智能应用落地。

算法算力智能中台核心引擎

智能云平台专利技术:PaaS+AI+大数据

产品特色

合作案例

算法算力智能中台

平台基于自主研发专利技术的PaaS+AI的技术架构,依托多年企业级软件技术和产品研发经验,为客户提供AI应用研发和运行的工程环境,一方面通过GPU资源虚拟化和分布式训练技术提供高效的算力优化管理,弹性灵活地满足不同场景机器学习对算力、性能、安全和成本的需求;另一方面平台预置常用AI框架,通过提供高效的机器学习开发运维(MLOps),全流程地支持AI模型的构建、训练、部署和运维。

算法算力智能中台分为底层基础设施资源层、资源调度层、平台功能层3个部分。

基础设施层主要为上层业务提供核心算力支撑,支持物理服务器、虚拟机、公有云等多种形式算力。其中CPU支持如Intel、AMD、鲲鹏、飞腾、海光等;GPU算力支持NVIDIA、昇腾、AMD、昆仑等;存储包括集中式存储和分布式存储,如华为、浪潮、杉岩等;网络包括传统以太网、ROCE、IB网络等以及防火墙、堡垒机等安全设备。

资源调度层借助Docker引擎实现CPU、GPU、内存、存储等资源的轻量级虚拟化,基于Kubernetes 和定制化开发的调度器实现对任务和资源的灵活编排调度,结合结合vGPU、vNPU、分布式训练、租户管理、任务编排等技术,让资源利用率提升50%以上,解决满不同机器学习场景下对算力、性能、安全和成本的需求。同时机器/深度学习框架以插件的方式接入系统,如Tensorflow,Caffe,Torch 和 Teano 等,有效提升整体系统的扩展性和可维护性。

平台功能层提供用户界面和管理界面两个UI界面。其中用户端包含了开发模块、训练模块、数据管理模块、模型服务模块、镜像仓库等实现机器学习MLOps支撑与管理;管理端包含主机管理、多租户管理、计量计费、告警监控设置、平台运营运维等,实现资源与用户的一站式管理。

数据

预训练

基础模型

生产模型

应用生产环境

(模型推理/运维)

业务模块独立,资源独享

资源浪费,用户操作复杂度较高……

资源共享统一管理,提高资源利用率

业务流程服务自动化,用户按需使用……