平台描述
人工智能人才紧缺,供需比仅为1:10,但面向众多学生的人工智能实验却难以开展。对此,AIRack人工智能实验平台提供了基于Docker容器集群技术开发的多人在线实验环境。平台基于深度学习计算集群,支持主流深度学习框架,方便快速部署训练环境,同时支持多人在线实验,并配套实验手册,同步解决人工智能实验配置难度大、实验入门难、缺乏实验数据等难题,可用于深度学习模型训练等教学、实践应用。
平台特性
在线实验应用
一键部署深度学习计算环境,快速启动训练任务
支持多个人工智能实验在线训练
动态分配GPU资源,实现资源的合理共享
实时监控与掌握CPU/GPU资源使用情况及运行状态
提供人工智能配套资源下载服务
实验高效可靠
基于Docker容器技术,可瞬间创建随时运行的实验环境
使用几台机器即可虚拟出大量实验集群,并配套GPU,满足实验室规模使用需求
采用Kubernetes容器编排架构管理集群,用户实验集群隔离、互不干扰
软硬件高规格
硬件采用GPU+CPU混合架构,实现对数据的高性能并行处理
CPU选用英特尔E5-2600系列至强处理器,搭配英伟达多系列GPU
最大可提供每秒176万亿次的单精度计算能力
预装CentOS和Ubuntu操作系统,集成Caffe、TensorFlow、PyTorch、Keras等主流深度学习框架
一站式服务
人工智能实验平台从实验环境、教材PPT、实验手册、实验数据、技术支持等多方面为人工智能课程提供一站式服务,大幅度降低人工智能课程学习门槛,满足课程设计、课程上机实验、实习实训、科研训练等多方面需求。
1.前沿教材PPT
平台提供由清华大学博士、中国信息协会大数据分会副会长刘鹏教授主编的《深度学习》配套PPT。内容涉及人脑神经系统与深度学习、深度学习主流模型以及深度学习在图像、语音、文本中的应用等丰富内容。
此外,还有10本正在筹备的书籍,也可为高校开展人工智能教学实验提供相关帮助。
2.专业的实验
配套包括116个人工智能相关的实验,主要分别为四个模块,每个模块具体内容如下:
①基础实验:Linux基础实验,python基础实验,基本工具使用
②机器学习实验:常用机器学习Python库,机器学习算法实验
③深度学习基础实验:图像处理,Caffe基础使用,TensorFlow基础使用,Keras基础使用,PyTorch基础使用。
④深度学习算法实验:基础实验,进阶实验
3.丰富的数据
提供实验代码以及MNIST、CIFAR-10、ImageNet、CASIA WebFace、Pascal VOC、Sift Flow等训练数据集
实验数据做打包处理,为用户提供便捷、可靠的人工智能和深度学习应用
平台框架
AIRack人工智能实验平台整体设计基于Docker容器集群技术,可一键创建随时运行的实验环境:
1.Kubernetes是Google开源的容器集群管理系统,提供应用部署、维护、扩展机制等功能,利用Kubernetes能方便地管理跨机器运行容器化的应用。
2.实验时,系统预先针对人工智能实验内容构建好一系列基于CentOS7或Ubuntu的特定容器镜像,通过Docker在集群主机内构建容器,为每个使用平台的用户开辟隔离的实验环境。
平台配置
管理服务器配置参数:
产品型号 | 详细配置 | 单位 | 数量 |
CPU | Xeon E5-2620 V4 | 颗 | 2 |
内存 | 32GB 内存 | 根 | 3 |
SSD | 480GB SSD固态硬盘 | 块 | 2 |
硬盘 | 240G固态硬盘 | 块 | 1 |
企业硬盘 | 4TB 7.2K RPM 企业硬盘 | 块 | 1 |
处理服务器配置参数:
产品型号 | 详细配置 | 单位 | 数量 |
CPU | Xeon E5-2650 V4 | 颗 | 2 |
内存 | 32GB 内存 | 根 | 8 |
SSD | 480GB SSD固态硬盘 | 块 | 2 |
硬盘 | 240G固态硬盘 | 块 | 1 |
GPU | GeForce RTX 2080 | 块 | 8 |
支持同时上机人数与服务器数量:
上机人数 | 服务器数量 |
8人 | 1(管理服务器)+1(处理服务器) |
24人 | 1(管理服务器)+3(处理服务器) |
48人 | 1(管理服务器)+6(处理服务器) |
72人 | 1(管理服务器)+9(处理服务器) |