2023年12月11日发(作者:涂安柏)
昇腾全栈AI软硬件平台昇腾全栈AI软硬件平台极简易用,极致性能,构筑智能世界的基石超强算力超强AI算力,更优能效比端边云协同一次开发,多次部署全栈开放软硬件开放,使能伙伴使能应用业务快速上线应用使能ModelArtsHiAI ServiceMindX行业SDK:mxVision / mxManufacture智能边缘使能:MindX Edge优选模型库:ModelZoo深度学习使能:MindX DL第三方平台全流程开发工具链MindStudio管理运维工具昇腾社区FusionDirector / 框架:MindSpore / TensorFlow / PyTorch / …芯片使能:CANNAtlas 200AI加速模块Atlas 300I推理卡Atlas 300T 训练卡Atlas 900 PoDAtlas 500智能小站Atlas 500 Pro智能边缘服务器Atlas 800推理服务器Atlas 800训练服务器Atlas 900AI集群Atlas 200 AI加速模块型号:3000Atlas 200 AI加速模块(型号:3000)集成了昇腾310 AI处理器,可以在端侧实现目标识别、图像分类等,广泛用于智能摄像机、机器人、无人机等端侧AI场景。产品规格极致性能••半张信用卡大小即可提供22 TOPS INT8算力,支持20路高清视频实时分析(1080P 25FPS)多级算力配置,支持22/16/8 TOPS三级算力内存规格LPDDR4X,8 GB/4 GB,总带宽51.2 GB/sAI算力AI芯片昇腾31022/16/8 TOPS INT8
11/8/4 TFLOPS FP16超低功耗•支持毫瓦级休眠、毫秒级唤醒,典型功耗仅5.5 W,使能边缘•AI应用支持H.264硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)•支持H.265硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)应用场景嵌入边缘设备,使能智能边缘摄像机机器人编解码能力•••支持H.264硬件编码,1路1080P 30 FPS支持H.265硬件编码,1路1080P 30 FPSJPEG解码能力1080P 256 FPS,编码能力1080P 64FPS,最大分辨率:8192*4320•PNG解码能力1080P 24 FPS,最大分辨率:4096*2160•PCIe×4 Gen3.0×1USB2.0 / USB3.0×1 RGMII无人机工控机接口••串行总线接口规格UART / I2C / SPI144 pin BTB连接器4 GB: 5.5 W / 8 GB: 8 W-25℃~ 80℃30 g52.6 mm *38.5 mm *8.5 mm图像分析视频分析典型功耗工作环境温度图像分割物体识别重量结构尺寸构建万物互联的智能世界Atlas 200 DK 开发者套件型号:3000Atlas 200 DK 开发者套件(型号:3000)是一款高性能AI应用开发板,集成了昇腾310 AI处理器,方便用户快速开发、快速验证,可广泛应用于开发者方案验证、高校教育、科学研究等场景。高集成度•基于华为昇腾310 AI处理器,集成丰富的外设接口和MindStudio开发环境,方便开发者简捷接入、快速开发产品规格AI芯片昇腾31022/16/8 TOPS INT811/8/4 TFLOPS FP16LPDDR4X,8 GB,总带宽51.2 GB/sAI算力易用的软件环境•MindStudio编程界面友好,具备图形化调试能力,可全自动管理离线模型并提供仿真环境内存规格•支持H.264 硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)•支持H.265 硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)应用场景编解码能力•••支持H.264 硬件编码,1路1080P 30 FPS支持H.265 硬件编码,1路1080P 30 FPSJPEG解码能力1080P 256 FPS,编码能力1080P 64开发者方案验证模型验证方案验证FPS,最大分辨率:8192*4320•PNG解码能力1080P 24 FPS,最大分辨率:4096*2160•网络:1个GE RJ45USB: 1个USB2.0 / USB3.0Camera:2个51 pin 相机连接器其他:1个40 pin IO连接器高校教育AI入门教育人才培养接口•••电源5~28 V DC,默认配置12 V / 3 A适配器典型功耗20 W0℃~35℃137.8 mm * 93.0 mm * 32.9 mm科学研究应用研究算法研究功耗工作环境温度结构尺寸构建万物互联的智能世界Atlas 300I 推理卡型号:3000/3010Atlas 300I 推理卡(型号:3000/3010)基于昇腾310 AI处理器,提供超强AI推理性能,单卡算力可达88 TOPS
INT8,支持80路高清视频实时分析,可广泛应用于智慧城市、智慧交通、智慧金融等场景。超强算力•单卡提供88 TOPS INT8算力,支持80路高清视频实时分析(1080P 25FPS),为边缘推理提供更强大支持产品规格形态AI芯片半高半长PCIe卡昇腾31088 TOPS INT844 TFLOPS FP16LPDDR4X32 GB,总带宽204.8 GB/s硬件编解码•支持JPEG和视频硬件编解码,提升图片和视频类应用性能AI算力内存规格低时延•内存容量大、带宽高,满足特征匹配场景内存需求,降低应用时延•支持H.264硬件解码,64路1080P 30 FPS(8路3840*2160 60 FPS)•支持H.265硬件解码,64路1080P 30 FPS(8路3840*2160 60 FPS)应用场景集成于服务器、工控机中,进行AI推理编解码能力•••支持H.264硬件编码,4路1080P 30 FPS支持H.265硬件编码,4路1080P 30 FPSJPEG解码能力4*1080P 256 FPS,编码能力4*1080P64 FPS,最大分辨率:8192*4320•PNG解码能力4*1080P 48 FPS,最大分辨率:4096*2160智慧城市智慧交通智慧社区智慧营业厅PCIe功耗工作环境温度结构尺寸PCIex16 Gen3.0(型号:3010)PCIex8 Gen3.0(型号:3000)最大67 W0℃~ 55℃169.5 mm * 68.9 mm智能制造无人零售智能楼宇智慧金融构建万物互联的智能世界Atlas 300T 训练卡型号:9000华为Atlas 300T 训练卡(型号:9000)是基于昇腾910 AI芯片,配合服务器,为数据中心提供强劲算力的AI加速卡,单卡可提供最高280 TFLOPS FP16算力,加快深度学习训练进程。Atlas 300T具有最强算力、最高集成、最快带宽等特点,满足互联网、运营商、金融等需要人工智能训练以及高性能计算领域的算力需求。产品规格形态全高,3/4长,双槽位昇腾910
最强算力••内置32个达芬奇AI Core提供业界领先的280 TFLOPS FP16算力AI处理器最高集成••AI算力、通用算力、I/O能力三合一芯片集成32个华为达芬奇AI Core + 16个TaiShan核 + 1 *100GE RoCE v2网卡AI算力280 TFLOPS FP16 (Pro)256 TFLOPS FP16•支持16 channel 4K(或64 channel 1080P)60最快带宽•支持PCIe 4.0和 1*100G RoCE高速接口,出口总带宽56.5Gb/s•无需外置网卡,训练数据和梯度同步效率提升10%-70%编解码能力•FPS H.264/H.265JPEG解码能力1080P 2048 FPS, 或等价的解码能力, 最高分辨率为8192*4320•PNG解码能力1080P 240 FPS, 或等价的解码能力, 最高分辨率为4096*2160•JPEG编码能力1080P 256 FPS, 或等价的编码能力, 最高分辨率为8192*4320应用场景••32 GB HBM16 GB DDR4内存规格模型训练HPC网络PCIe功耗散热方式1*100GE QSFP-DD接口PCIex16 Gen4.0最大300W①被动风冷智慧城市智慧交通工作温度5℃~45℃智能制造智慧金融①持续调优中,数值根据调优结果动态更新构建万物互联的智能世界Atlas 500 智能小站型号:3000Atlas 500智能小站(型号:3000)是面向边缘应用的产品,具有超强计算性能、体积小、环境适应性强、易于维护和支持云边协同等特点,可以在边缘环境广泛部署,满足在安防、交通、社区、园区、商场、超市等复杂环境区域的应用需求。智能边缘••业界领先的集成AI处理能力的边缘产品无风扇散热,支持-40 ℃至70 ℃室外工作产品规格AI芯片AI算力内存规格昇腾31022/16 TOPS INT811/8 TFLOPS FP16LPDDR4X,8 GB / 4 GB,最大51.2 GB/s支持H.264硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)支持H.265硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)编解码能力支持H.264硬件编码,1路1080P 30 FPS小身材大能量••机顶盒大小即支持22 TOPS INT8算力支持20路高清视频处理(1080P 25FPS)边云协同•••支持LTE无线传输云边协同,模型实时更新可在云端统一进行设备管理和固件升级支持H.265硬件编码,1路1080P 30 FPSJPEG解码能力1080P 256 FPS,编码能力1080P 64
FPS,最大分辨率:8192*4320PNG解码能力1080P 24 FPS,最大分辨率:4096*2160网络:2个GE RJ45应用场景边缘侧独立部署,使能智能边缘接口智慧变电站智慧交通智慧社区环境监控典型功耗环境条件智能制造智慧营业厅无人零售智能楼宇结构尺寸其他I/O:1个HDMI接口,1对3.5 mm立体声输入输出接口;2个外部和1个内部USB2.0接口(Type-A)无盘配置:25 W有盘配置:40 W无盘配置:-40ºC ~ 70ºC有盘配置:-40ºC ~ 60ºC无盘配置:45 mm * 235 mm *220 mm有盘配置:45 mm *355 mm *220mm构建万物互联的智能世界Atlas 500 Pro 智能边缘服务器型号:3000Atlas 500 Pro 智能边缘服务器(型号:3000)是面向边缘应用的产品,具有超强计算性能、高环境适应性、易于部署维护和支持云边协同等特点。可以在边缘场景中广泛部署,满足在安防、交通、社区、园区、商场、超市等复杂环境区域的应用需求。超强算力••最大支持4张Atlas 300I 推理卡,满足多场景推理需求;整机可提供320路高清视频实时分析(1080P 25 FPS)搭载64核架构、具有超强算力的鲲鹏920处理器,高效加速应用产品规格形态CPUCPU内存AI加速卡AI算力本地存储RAID支持PCIe板载网卡2U AI服务器1 * 鲲鹏9204个DDR4内存插槽,最高2933 MT/s最大支持4个Atlas 300I AI推理卡最大352 TOPS INT8(8~12)*3.5 SAS/SATARAID 1/5/6/10等最多4个PCIe4.0 x8标准扩展槽位4*10GE/25GE(光口)+2*GE(电口)•2个550W或900W交流热插拔电源,支持AC220V/DC 240V或者2个1200W直流热插拔电源,支持DC -48V•风扇支持1+1冗余超高能效••发挥鲲鹏架构多核、低功耗优势,为推理场景构建高效能、低功耗的AI计算平台Atlas 300I 单卡功耗仅67W,为AI服务器算力加速同时提供更优的能效比应用场景边缘侧独立部署,使能智能边缘电源4个热拔插风扇,支持N+1冗余••长期:5°C ~ 50°C短期:0°C ~ 55°C智慧变电站智慧交通智慧社区环境监控工作环境温度结构尺寸86.1 mm * 447 mm * 475 mm智能制造智慧营业厅无人零售智能楼宇构建万物互联的智能世界Atlas 800 推理服务器型号:3000Atlas 800 推理服务器(型号:3000)是基于昇腾310芯片的推理服务器,最大可支持8个Atlas 300I 推理卡,提供强大的实时推理能力,广泛应用于中心侧AI推理场景。超强算力••支持8张Atlas 300I 推理卡,满足多场景推理需求;整机可产品规格形态CPUCPU内存AI加速卡AI算力2U AI服务器2 * 鲲鹏92032个DDR4内存插槽,最高2933 MT/s最大支持8个Atlas 300I 推理卡最大704 TOPS INT825*2.5 SAS/SATA本地存储12*3.5 SAS/SATA8*2.5 SAS/SATA+12x2.5 NVMeRAID支持RAID 0/1/10/5/50/6/60等最多支持9个PCIe4.0 PCIe接口,其中1个为RAID扣提供640路高清视频实时分析(1080P 25FPS)搭载64核架构、具有超强算力的鲲鹏920处理器,高效加速应用超高能效••发挥鲲鹏架构多核、低功耗优势,为推理场景构建高效能、低功耗的AI计算平台Atlas 300I 单卡功耗仅67W,为AI服务器算力加速同时提供更优的能效比应用场景部署在数据中心机房,使能中心推理PCIe卡专用的PCIe扩展槽位,另外8个为标准的PCIe扩展槽位电源风扇2个热插拔900 W或2000 W交流电源模块,支持1+1冗余备份4个热拔插风扇,支持N+1冗余备份工作环境温度5°C ~ 40°C精准营销医疗影像分析视频分析OCR结构尺寸447 mm * 790 mm * 86.1 mm智慧零售智慧医疗智慧城市智慧金融构建万物互联的智能世界Atlas 800 推理服务器型号:3010Atlas 800 推理服务器(型号:3010)是基于Intel处理器的推理服务器,最多可支持7个Atlas 300I 推理加速卡,支持560路高清视频实时分析,广泛应用于中心侧AI推理场景。产品规格形态2U AI服务器1/2个Intel® Xeon® SP Skylake或Cascade Lake处理器,最高205W24个DDR4内存插槽,最高2933 MT/s最大支持7个Atlas 300I 推理卡最大616 TOPS INT88*2.5 SAS/SATA12*3.5 SAS/SATA本地存储8* 2.5 SAS/SATA+12*2.5 NVMe24*2.5 SAS/SATA24*2.5 NVMe灵活配置,适配多项负载•支持SAS/SATA/NVMe/M.2 SSD硬盘多种组合灵活配置CPUCPU内存AI加速卡AI算力•支持板载网卡和灵活I/O卡,提供丰富多样的网络接口智能视频分析•最大支持7张Atlas 300I 推理卡,支持560路高清视频实时分析(1080P 25FPS)应用场景部署在数据中心机房,使能中心推理RAID支持PCIe25*2.5 SAS/SATARAID 0/1/5/6/10/1E/50/60等10个PCIeGen3.0接口(含1个RAID控制卡+1个灵活LOM)可配置2个冗余热插拔电源,支持1+1冗余备份,选择规格如下:550 W AC 白金电源、900 W AC 白金/钛金电源、1500 W AC 白金电源1500 W 380 V 高压直流电源、1200 W -48 V ~ -60 V 直流电源风扇4个热拔插风扇,支持N+1冗余备份精准营销医疗影像分析视频分析OCR电源智慧零售智慧医疗智慧城市智慧金融工作环境温度5℃~45℃3.5英寸硬盘机箱尺寸:结构尺寸86.1 mm * 447 mm * 748 mm2.5英寸硬盘机箱尺寸:86.1 mm * 447 mm * 708 mm构建万物互联的智能世界Atlas 800 训练服务器型号:9000Atlas 800 训练服务器(型号:9000)是基于华为鲲鹏920+昇腾910处理器的AI训练服务器,具有最强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。产品规格形态CPU4U AI服务器4 * 鲲鹏920•CPU内存••AI处理器HBMAI算力最多32个DDR4内存插槽,支持RDIMM内存速率最高2933 MT/s单根内存条容量支持32 GB/64 GB最强算力密度••4U高度提供2.56 PFLOPS FP16超强算力算力密度达到业界1.7倍超高能效••单机支持风冷和液冷两种散热方式提供2.56 PFLOPS/5.6 kW①超高能效比,达到业界1.3倍8 * 昇腾9108 * 32 GB2.56 / 2.24 / 2 PFLOPS FP16••2 * 2.5 SAS/SATA+3 * 2.5 NVMe2 * 2.5 SATA+3 * 2.5 NVMe2 * 2.5 SAS/SATA+6 * 2.5 NVMe2 * 2.5 SATA+6 * 2.5 NVMe2 * 2.5 SATA+8 * 2.5 SAS/SATA高速网络带宽••8*100G RoCEv2高速接口芯片间跨服务器互联时延缩短10~70%本地存储•••RAID支持支持RAID 0/1/10/5/50/6/608 * 100GE+ 4 * 25GE/2 * 100GE最多支持2个PCIe4.0扩展插槽4个热插拔2 kW或3 kW交流电源模块,支持2+2冗余••200 ~ 240 V AC240 V DC应用场景部署在数据中心机房,使能中心训练模型训练HPC网络PCIe扩展电源供电智慧城市智慧医疗功耗散热方式风扇天文探索石油勘探工作温度结构尺寸最大功耗5.6 kW①风冷/液冷支持8个热拔插风扇模组,支持N+1冗余5℃~40℃(液冷)5℃~35℃(风冷)175 mm * 447 mm * 790 mm构建万物互联的智能世界①持续调优中,数值根据调优结果动态更新Atlas 800 训练服务器型号:9010Atlas 800 训练服务器(型号:9010)是基于Intel处理器+华为昇腾910芯片的AI训练服务器,具有最强算力密度、高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。产品规格形态CPU4U AI服务器2 * Intel V5 Cascade Lake处理器最多24个DDR4内存插槽,支持RDIMM8 * 昇腾9108 * 32 GB2.24 PFLOPS FP162 PFLOPS FP16••2 * 2.5 SATA+8 * 2.5 SAS/SATA2 * 2.5 SAS/SATA+6 * 2.5 NVMe最强算力密度••4U高度提供最高2.24 PFLOPS FP16超强算力算力密度达到业界1.5倍CPU内存AI处理器HBM高速网络带宽•8*100G RoCEv2高速接口,芯片间跨服务器互联时延缩短10~70%AI算力应用场景部署在数据中心机房,使能中心训练本地存储RAID支持模型训练HPC网络支持RAID 0/1/10/5/50/6/608 * 100GE1* OCP NIC 3.0标卡,支持2 * 25GE最多支持2个PCIe3.0 x16和4个PCIe3.0 x8PCIe扩展智慧城市智慧医疗电源扩展插槽4个热插拔2 kW或3 kW交流电源模块支持2+2冗余••200 ~ 240 V AC240 V DC天文探索石油勘探供电功耗散热方式风扇工作温度最大功耗5.6 kW①风冷支持8个热拔插风扇模组,支持N+1冗余5℃~35℃结构尺寸175 mm * 447 mm * 790 mm①持续调优中,数值根据调优结果动态更新构建万物互联的智能世界Atlas 900 PoD型号:9000Atlas 900 PoD(型号:9000)是基于华为昇腾910 +
鲲鹏920 处理器的AI训练集群基础单元,具有超强AI算力、更优AI能效、最佳AI拓展等特点。该基础单元广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大AI算力的领域。产品规格形态CPU47U 机柜32 * 鲲鹏920•CPU内存最多256个DDR4内存插槽,支持超强AI算力•47U 高度提供最高20.48 PFLOPS FP16超强AI算力RDIMM•单根内存条容量支持32 GB/64 GB更优AI能效•提供20.48 PFLOPS/43 kW超高能效比AI处理器HBMAI算力AI算力扩展本地存储64 * 昇腾9102048 GB最高20.48 PFLOPS FP16最大可扩展至1 EFLOPS FP16最大支持64 * 2.5英寸硬盘支持RAID 0/1••交流:6路3+3,电源:380V/32A直流:4路2+2,电源:380V/32A最佳AI拓展•支持机柜单元扩展,最大可拓展至4096颗昇腾910芯片集群,总算力达1 EFLOPS FP16应用场景RAID支持供电模型训练HPC功耗散热方式温度最大功耗43 kW液冷•工作温度:5℃~40℃智慧城市智慧医疗(符合ASHRAE Class A2/A3/A4)•2250mm×600mm×1200mm(半液冷,无风液换热器)•天文探索石油勘探结构尺寸2250mm×600mm×1250mm(半液冷,安装液冷前后门)(H*W*D)•2250mm×600mm×1350mm(全液冷,无风液换热器)•2250mm×600mm×1375mm(全液冷,安装液冷前门)构建万物互联的智能世界异构计算架构-CANNCANN(Compute Architecture for Neural Networks)是专为深度学习所设计的异构计算架构,通过各核心组件充分释放昇腾处理器澎湃算力,支持用户快速构建基于昇腾平台的AI应用和业务,主要包含AscendCL、DVPP、HCCL等组件:昇腾统一编程接口AscendCL实现软硬件解耦;华为通信集合库HCCL在分布式训练中为不同昇腾AI处理器之间提供高效的数据传输能力;DVPP实现硬件加速,提升图像预处理并行能力。使能全场景向下支持14+操作系统;底层支持10+端边云设备形态;向上能够适配多种AI框架使能极致性能亲和昇腾的极致图编译技术;丰富的高性能算子使能极简开发统一API适配全系列硬件;四大开放性设计:Plugin适配、图融合接口、Ascend-IR、算子库构建万物互联的智能世界全场景AI计算框架-MindSpore
MindSpore是新一代全场景AI计算框架,最佳匹配昇腾AI处理器算力,支持端、边、云全场景灵活部署,开创全新的AI编程范式,降低AI开发门槛,旨在实现开发态友好、运行态高效、部署态灵活三大目标,推动人工智能软硬件应用生态繁荣发展。全流程极简•••模型开发套件,“即开即用”模型调优套件,“所见即所得”第三方支持套件,“一键式转换”Cloud全自动并行••一行代码,串行算法并行化张量自动切分,最大化并行效率全场景协同•全场景自适应部署,跨异构硬件执行,无需模型转换•端侧轻量学习,模型“私人订制”构建万物互联的智能世界全流程开发工具链-MindStudioMindStudio提供了AI开发所需的一站式开发环境,支持模型开发、算子开发及应用开发的全流程任务。依靠模型可视化、算力测试、IDE本地仿真调试等功能,帮助开发者高效便捷的完成AI开发。模型开发MindStudio包含了模型开发所涉及的推理、训练全系列工具,同时支持随时调用ModelZoo中提供的大量预训练好的AI模型、模型训练脚本以及模型开发案例,让开发者能够最高效的完成AI模型的开发。算子开发MindStudio兼顾算子开发的易用性与灵活性,提供了DSL和TIK两种算子开发方式,在算子开发过程中,还提供了性能调优与精度比对等功能。TBE-DSL最优开发效率••自动实现数据切分和调度,只需关注计算表达覆盖70%算子,算子开发时间较业界降低70%••TBE-TIK最佳算子性能提供指令级编程和调优能力,需关注指令集调用过程和数据切分及编排覆盖全部算子,可以发挥芯片的极致性能应用开发通过AscendCL接口,进行系统级调优、调试传输等AI应用开发,提供模型/算子加载与执行、多种C++的API接口等功能。应用部署通过连接IP地址统一管理调试设备,实现远程管理、调试及应用推送,无缝兼容不同形态的设备。系统管理由FusionDirector及SmartKit组成的昇腾云边协同工具,可以让开发者对系统进行实时地设备管理、模型部署等操作。构建万物互联的智能世界昇腾应用使能-MindX昇腾应用使能MindX为行业应用开发者而设计,快速使能开发者进行各行业AI应用开发。MindX包含“2+1+X”,深度学习使能MindXDL 、智能边缘使能MindXEdge、1个优选模型库ModelZoo和X个行业SDK深度学习使能-MindXDL数据中心计算资源统一管理与调度,使能合作伙伴快速开发深度学习系统第三方深度学习系统ModelArts 第三方云平台计算资源最优化调度支持NPU设备发现、集合通信优化、大批量数据群组调度边云协同参考设计支持中心训练模型发布、更新、推送至边缘进行推理,形成模型的完整闭环智能边缘使能-MindXEdge轻量化的边缘计算资源管理运维,使能行业客户快速搭建边云协同推理平台边云协同设计云端模型推送至边缘快速部署边缘数据支持上传云端持续训练多样化硬件形态支持摄像头、工控机、机器人、无人机、边缘推理服务器…轻量化部署极致轻量化,平台内存开销仅256MB,CPU占用率仅3%优选模型库-ModelZoo易获取> ModelZoo为开发者提供丰富的场景化优选预训练模型,为开发者解决了模型的选型难、训练难、优化难等问题多种框架MindSpore、TensorFlow、PyTorch、Caffe等多场景OCR、图像检测、图像分类、图像分割、推荐类、NLP、机器翻译、语音生成、增强学习等高性能模型提前调优并保障精度性能构建万物互联的智能世界昇腾应用使能-MindX行业应用开发套件-MindXSDK面向行业场景的完整AI开发套件,提供极简易用的API及图形界面,使能开发者以极少代码快速开发行业AI应用管理业务流和生成推理服务。StreamManager负mxStream责业务流的构建和销毁,同时提供发送数据和获取结果的接口;StreamServer将Stream构建成推理服务,对外提供restful接口接收推理请求。mxPlugins基础功能插件,例如模型推理插件、图像解码插件昇腾芯片功能基础库:包括图像编解码、裁剪缩放,模型推理SDK提供的开发工具。其中PluginToolkit提供插件开发的APImxBasemxTools已上线昇腾社区制造mxManufacture视觉mxVision请访问昇腾社区获取更多支持构建万物互联的智能世界昇腾计算产业生态昇腾计算产业生态包括围绕着昇腾计算技术和产品体系所开展的学术、技术、公益及商业活动,产生的知识和产品以及各种合作伙伴,主要包括硬件合作伙伴、软件算法合作伙伴、初创公司、高校和业界开发者。以上共同构成了昇腾产业的合作伙伴生态体系,不同的角色相互配合,共同促进AI赋能千行百业。昇腾计算产业硬件开放,软件开源,使能合作伙伴1个创新发展的AI计算产业2大商业扶植计划3大人才培养措施昇腾使能千行百业的智能化转型助力昇腾合作伙伴商业成功昇腾万里ISV合作伙伴发展计划实现联合方案的商业成功昇腾万里初创伙伴加速计划加速初创企业的创新和成长为昇腾产业长期发展培育核心人才昇腾高校教学合作计划MindSpore论文+模型开发激励计划昇腾开发人员成长计划2大昇腾生态发展的基础平台昇腾生态创新中心昇腾开发者社区制造交通自由流收费高速视频云联网车辆稽核能源输电线路智能运检智能变电站智能营业厅智能加油站金融智慧网点金融OCR互联网精准推荐内容审核医疗肺炎诊断骨龄检测与业界TOP
ISV联合创新工业质检(烟草、半导体、PCB、线管材、镜筒)昇腾系列教材让昇腾成为昇腾AI处理器架构与编程深度学习与MindSpore实践ModelArts人工智能应用开发指南高校学生必备技能高校合作“智能基座”产教融合协同育人基地构建万物互联的智能世界
2023年12月11日发(作者:涂安柏)
昇腾全栈AI软硬件平台昇腾全栈AI软硬件平台极简易用,极致性能,构筑智能世界的基石超强算力超强AI算力,更优能效比端边云协同一次开发,多次部署全栈开放软硬件开放,使能伙伴使能应用业务快速上线应用使能ModelArtsHiAI ServiceMindX行业SDK:mxVision / mxManufacture智能边缘使能:MindX Edge优选模型库:ModelZoo深度学习使能:MindX DL第三方平台全流程开发工具链MindStudio管理运维工具昇腾社区FusionDirector / 框架:MindSpore / TensorFlow / PyTorch / …芯片使能:CANNAtlas 200AI加速模块Atlas 300I推理卡Atlas 300T 训练卡Atlas 900 PoDAtlas 500智能小站Atlas 500 Pro智能边缘服务器Atlas 800推理服务器Atlas 800训练服务器Atlas 900AI集群Atlas 200 AI加速模块型号:3000Atlas 200 AI加速模块(型号:3000)集成了昇腾310 AI处理器,可以在端侧实现目标识别、图像分类等,广泛用于智能摄像机、机器人、无人机等端侧AI场景。产品规格极致性能••半张信用卡大小即可提供22 TOPS INT8算力,支持20路高清视频实时分析(1080P 25FPS)多级算力配置,支持22/16/8 TOPS三级算力内存规格LPDDR4X,8 GB/4 GB,总带宽51.2 GB/sAI算力AI芯片昇腾31022/16/8 TOPS INT8
11/8/4 TFLOPS FP16超低功耗•支持毫瓦级休眠、毫秒级唤醒,典型功耗仅5.5 W,使能边缘•AI应用支持H.264硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)•支持H.265硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)应用场景嵌入边缘设备,使能智能边缘摄像机机器人编解码能力•••支持H.264硬件编码,1路1080P 30 FPS支持H.265硬件编码,1路1080P 30 FPSJPEG解码能力1080P 256 FPS,编码能力1080P 64FPS,最大分辨率:8192*4320•PNG解码能力1080P 24 FPS,最大分辨率:4096*2160•PCIe×4 Gen3.0×1USB2.0 / USB3.0×1 RGMII无人机工控机接口••串行总线接口规格UART / I2C / SPI144 pin BTB连接器4 GB: 5.5 W / 8 GB: 8 W-25℃~ 80℃30 g52.6 mm *38.5 mm *8.5 mm图像分析视频分析典型功耗工作环境温度图像分割物体识别重量结构尺寸构建万物互联的智能世界Atlas 200 DK 开发者套件型号:3000Atlas 200 DK 开发者套件(型号:3000)是一款高性能AI应用开发板,集成了昇腾310 AI处理器,方便用户快速开发、快速验证,可广泛应用于开发者方案验证、高校教育、科学研究等场景。高集成度•基于华为昇腾310 AI处理器,集成丰富的外设接口和MindStudio开发环境,方便开发者简捷接入、快速开发产品规格AI芯片昇腾31022/16/8 TOPS INT811/8/4 TFLOPS FP16LPDDR4X,8 GB,总带宽51.2 GB/sAI算力易用的软件环境•MindStudio编程界面友好,具备图形化调试能力,可全自动管理离线模型并提供仿真环境内存规格•支持H.264 硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)•支持H.265 硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)应用场景编解码能力•••支持H.264 硬件编码,1路1080P 30 FPS支持H.265 硬件编码,1路1080P 30 FPSJPEG解码能力1080P 256 FPS,编码能力1080P 64开发者方案验证模型验证方案验证FPS,最大分辨率:8192*4320•PNG解码能力1080P 24 FPS,最大分辨率:4096*2160•网络:1个GE RJ45USB: 1个USB2.0 / USB3.0Camera:2个51 pin 相机连接器其他:1个40 pin IO连接器高校教育AI入门教育人才培养接口•••电源5~28 V DC,默认配置12 V / 3 A适配器典型功耗20 W0℃~35℃137.8 mm * 93.0 mm * 32.9 mm科学研究应用研究算法研究功耗工作环境温度结构尺寸构建万物互联的智能世界Atlas 300I 推理卡型号:3000/3010Atlas 300I 推理卡(型号:3000/3010)基于昇腾310 AI处理器,提供超强AI推理性能,单卡算力可达88 TOPS
INT8,支持80路高清视频实时分析,可广泛应用于智慧城市、智慧交通、智慧金融等场景。超强算力•单卡提供88 TOPS INT8算力,支持80路高清视频实时分析(1080P 25FPS),为边缘推理提供更强大支持产品规格形态AI芯片半高半长PCIe卡昇腾31088 TOPS INT844 TFLOPS FP16LPDDR4X32 GB,总带宽204.8 GB/s硬件编解码•支持JPEG和视频硬件编解码,提升图片和视频类应用性能AI算力内存规格低时延•内存容量大、带宽高,满足特征匹配场景内存需求,降低应用时延•支持H.264硬件解码,64路1080P 30 FPS(8路3840*2160 60 FPS)•支持H.265硬件解码,64路1080P 30 FPS(8路3840*2160 60 FPS)应用场景集成于服务器、工控机中,进行AI推理编解码能力•••支持H.264硬件编码,4路1080P 30 FPS支持H.265硬件编码,4路1080P 30 FPSJPEG解码能力4*1080P 256 FPS,编码能力4*1080P64 FPS,最大分辨率:8192*4320•PNG解码能力4*1080P 48 FPS,最大分辨率:4096*2160智慧城市智慧交通智慧社区智慧营业厅PCIe功耗工作环境温度结构尺寸PCIex16 Gen3.0(型号:3010)PCIex8 Gen3.0(型号:3000)最大67 W0℃~ 55℃169.5 mm * 68.9 mm智能制造无人零售智能楼宇智慧金融构建万物互联的智能世界Atlas 300T 训练卡型号:9000华为Atlas 300T 训练卡(型号:9000)是基于昇腾910 AI芯片,配合服务器,为数据中心提供强劲算力的AI加速卡,单卡可提供最高280 TFLOPS FP16算力,加快深度学习训练进程。Atlas 300T具有最强算力、最高集成、最快带宽等特点,满足互联网、运营商、金融等需要人工智能训练以及高性能计算领域的算力需求。产品规格形态全高,3/4长,双槽位昇腾910
最强算力••内置32个达芬奇AI Core提供业界领先的280 TFLOPS FP16算力AI处理器最高集成••AI算力、通用算力、I/O能力三合一芯片集成32个华为达芬奇AI Core + 16个TaiShan核 + 1 *100GE RoCE v2网卡AI算力280 TFLOPS FP16 (Pro)256 TFLOPS FP16•支持16 channel 4K(或64 channel 1080P)60最快带宽•支持PCIe 4.0和 1*100G RoCE高速接口,出口总带宽56.5Gb/s•无需外置网卡,训练数据和梯度同步效率提升10%-70%编解码能力•FPS H.264/H.265JPEG解码能力1080P 2048 FPS, 或等价的解码能力, 最高分辨率为8192*4320•PNG解码能力1080P 240 FPS, 或等价的解码能力, 最高分辨率为4096*2160•JPEG编码能力1080P 256 FPS, 或等价的编码能力, 最高分辨率为8192*4320应用场景••32 GB HBM16 GB DDR4内存规格模型训练HPC网络PCIe功耗散热方式1*100GE QSFP-DD接口PCIex16 Gen4.0最大300W①被动风冷智慧城市智慧交通工作温度5℃~45℃智能制造智慧金融①持续调优中,数值根据调优结果动态更新构建万物互联的智能世界Atlas 500 智能小站型号:3000Atlas 500智能小站(型号:3000)是面向边缘应用的产品,具有超强计算性能、体积小、环境适应性强、易于维护和支持云边协同等特点,可以在边缘环境广泛部署,满足在安防、交通、社区、园区、商场、超市等复杂环境区域的应用需求。智能边缘••业界领先的集成AI处理能力的边缘产品无风扇散热,支持-40 ℃至70 ℃室外工作产品规格AI芯片AI算力内存规格昇腾31022/16 TOPS INT811/8 TFLOPS FP16LPDDR4X,8 GB / 4 GB,最大51.2 GB/s支持H.264硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)支持H.265硬件解码,16路1080P 30 FPS(2路3840*2160 60 FPS)编解码能力支持H.264硬件编码,1路1080P 30 FPS小身材大能量••机顶盒大小即支持22 TOPS INT8算力支持20路高清视频处理(1080P 25FPS)边云协同•••支持LTE无线传输云边协同,模型实时更新可在云端统一进行设备管理和固件升级支持H.265硬件编码,1路1080P 30 FPSJPEG解码能力1080P 256 FPS,编码能力1080P 64
FPS,最大分辨率:8192*4320PNG解码能力1080P 24 FPS,最大分辨率:4096*2160网络:2个GE RJ45应用场景边缘侧独立部署,使能智能边缘接口智慧变电站智慧交通智慧社区环境监控典型功耗环境条件智能制造智慧营业厅无人零售智能楼宇结构尺寸其他I/O:1个HDMI接口,1对3.5 mm立体声输入输出接口;2个外部和1个内部USB2.0接口(Type-A)无盘配置:25 W有盘配置:40 W无盘配置:-40ºC ~ 70ºC有盘配置:-40ºC ~ 60ºC无盘配置:45 mm * 235 mm *220 mm有盘配置:45 mm *355 mm *220mm构建万物互联的智能世界Atlas 500 Pro 智能边缘服务器型号:3000Atlas 500 Pro 智能边缘服务器(型号:3000)是面向边缘应用的产品,具有超强计算性能、高环境适应性、易于部署维护和支持云边协同等特点。可以在边缘场景中广泛部署,满足在安防、交通、社区、园区、商场、超市等复杂环境区域的应用需求。超强算力••最大支持4张Atlas 300I 推理卡,满足多场景推理需求;整机可提供320路高清视频实时分析(1080P 25 FPS)搭载64核架构、具有超强算力的鲲鹏920处理器,高效加速应用产品规格形态CPUCPU内存AI加速卡AI算力本地存储RAID支持PCIe板载网卡2U AI服务器1 * 鲲鹏9204个DDR4内存插槽,最高2933 MT/s最大支持4个Atlas 300I AI推理卡最大352 TOPS INT8(8~12)*3.5 SAS/SATARAID 1/5/6/10等最多4个PCIe4.0 x8标准扩展槽位4*10GE/25GE(光口)+2*GE(电口)•2个550W或900W交流热插拔电源,支持AC220V/DC 240V或者2个1200W直流热插拔电源,支持DC -48V•风扇支持1+1冗余超高能效••发挥鲲鹏架构多核、低功耗优势,为推理场景构建高效能、低功耗的AI计算平台Atlas 300I 单卡功耗仅67W,为AI服务器算力加速同时提供更优的能效比应用场景边缘侧独立部署,使能智能边缘电源4个热拔插风扇,支持N+1冗余••长期:5°C ~ 50°C短期:0°C ~ 55°C智慧变电站智慧交通智慧社区环境监控工作环境温度结构尺寸86.1 mm * 447 mm * 475 mm智能制造智慧营业厅无人零售智能楼宇构建万物互联的智能世界Atlas 800 推理服务器型号:3000Atlas 800 推理服务器(型号:3000)是基于昇腾310芯片的推理服务器,最大可支持8个Atlas 300I 推理卡,提供强大的实时推理能力,广泛应用于中心侧AI推理场景。超强算力••支持8张Atlas 300I 推理卡,满足多场景推理需求;整机可产品规格形态CPUCPU内存AI加速卡AI算力2U AI服务器2 * 鲲鹏92032个DDR4内存插槽,最高2933 MT/s最大支持8个Atlas 300I 推理卡最大704 TOPS INT825*2.5 SAS/SATA本地存储12*3.5 SAS/SATA8*2.5 SAS/SATA+12x2.5 NVMeRAID支持RAID 0/1/10/5/50/6/60等最多支持9个PCIe4.0 PCIe接口,其中1个为RAID扣提供640路高清视频实时分析(1080P 25FPS)搭载64核架构、具有超强算力的鲲鹏920处理器,高效加速应用超高能效••发挥鲲鹏架构多核、低功耗优势,为推理场景构建高效能、低功耗的AI计算平台Atlas 300I 单卡功耗仅67W,为AI服务器算力加速同时提供更优的能效比应用场景部署在数据中心机房,使能中心推理PCIe卡专用的PCIe扩展槽位,另外8个为标准的PCIe扩展槽位电源风扇2个热插拔900 W或2000 W交流电源模块,支持1+1冗余备份4个热拔插风扇,支持N+1冗余备份工作环境温度5°C ~ 40°C精准营销医疗影像分析视频分析OCR结构尺寸447 mm * 790 mm * 86.1 mm智慧零售智慧医疗智慧城市智慧金融构建万物互联的智能世界Atlas 800 推理服务器型号:3010Atlas 800 推理服务器(型号:3010)是基于Intel处理器的推理服务器,最多可支持7个Atlas 300I 推理加速卡,支持560路高清视频实时分析,广泛应用于中心侧AI推理场景。产品规格形态2U AI服务器1/2个Intel® Xeon® SP Skylake或Cascade Lake处理器,最高205W24个DDR4内存插槽,最高2933 MT/s最大支持7个Atlas 300I 推理卡最大616 TOPS INT88*2.5 SAS/SATA12*3.5 SAS/SATA本地存储8* 2.5 SAS/SATA+12*2.5 NVMe24*2.5 SAS/SATA24*2.5 NVMe灵活配置,适配多项负载•支持SAS/SATA/NVMe/M.2 SSD硬盘多种组合灵活配置CPUCPU内存AI加速卡AI算力•支持板载网卡和灵活I/O卡,提供丰富多样的网络接口智能视频分析•最大支持7张Atlas 300I 推理卡,支持560路高清视频实时分析(1080P 25FPS)应用场景部署在数据中心机房,使能中心推理RAID支持PCIe25*2.5 SAS/SATARAID 0/1/5/6/10/1E/50/60等10个PCIeGen3.0接口(含1个RAID控制卡+1个灵活LOM)可配置2个冗余热插拔电源,支持1+1冗余备份,选择规格如下:550 W AC 白金电源、900 W AC 白金/钛金电源、1500 W AC 白金电源1500 W 380 V 高压直流电源、1200 W -48 V ~ -60 V 直流电源风扇4个热拔插风扇,支持N+1冗余备份精准营销医疗影像分析视频分析OCR电源智慧零售智慧医疗智慧城市智慧金融工作环境温度5℃~45℃3.5英寸硬盘机箱尺寸:结构尺寸86.1 mm * 447 mm * 748 mm2.5英寸硬盘机箱尺寸:86.1 mm * 447 mm * 708 mm构建万物互联的智能世界Atlas 800 训练服务器型号:9000Atlas 800 训练服务器(型号:9000)是基于华为鲲鹏920+昇腾910处理器的AI训练服务器,具有最强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。产品规格形态CPU4U AI服务器4 * 鲲鹏920•CPU内存••AI处理器HBMAI算力最多32个DDR4内存插槽,支持RDIMM内存速率最高2933 MT/s单根内存条容量支持32 GB/64 GB最强算力密度••4U高度提供2.56 PFLOPS FP16超强算力算力密度达到业界1.7倍超高能效••单机支持风冷和液冷两种散热方式提供2.56 PFLOPS/5.6 kW①超高能效比,达到业界1.3倍8 * 昇腾9108 * 32 GB2.56 / 2.24 / 2 PFLOPS FP16••2 * 2.5 SAS/SATA+3 * 2.5 NVMe2 * 2.5 SATA+3 * 2.5 NVMe2 * 2.5 SAS/SATA+6 * 2.5 NVMe2 * 2.5 SATA+6 * 2.5 NVMe2 * 2.5 SATA+8 * 2.5 SAS/SATA高速网络带宽••8*100G RoCEv2高速接口芯片间跨服务器互联时延缩短10~70%本地存储•••RAID支持支持RAID 0/1/10/5/50/6/608 * 100GE+ 4 * 25GE/2 * 100GE最多支持2个PCIe4.0扩展插槽4个热插拔2 kW或3 kW交流电源模块,支持2+2冗余••200 ~ 240 V AC240 V DC应用场景部署在数据中心机房,使能中心训练模型训练HPC网络PCIe扩展电源供电智慧城市智慧医疗功耗散热方式风扇天文探索石油勘探工作温度结构尺寸最大功耗5.6 kW①风冷/液冷支持8个热拔插风扇模组,支持N+1冗余5℃~40℃(液冷)5℃~35℃(风冷)175 mm * 447 mm * 790 mm构建万物互联的智能世界①持续调优中,数值根据调优结果动态更新Atlas 800 训练服务器型号:9010Atlas 800 训练服务器(型号:9010)是基于Intel处理器+华为昇腾910芯片的AI训练服务器,具有最强算力密度、高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。产品规格形态CPU4U AI服务器2 * Intel V5 Cascade Lake处理器最多24个DDR4内存插槽,支持RDIMM8 * 昇腾9108 * 32 GB2.24 PFLOPS FP162 PFLOPS FP16••2 * 2.5 SATA+8 * 2.5 SAS/SATA2 * 2.5 SAS/SATA+6 * 2.5 NVMe最强算力密度••4U高度提供最高2.24 PFLOPS FP16超强算力算力密度达到业界1.5倍CPU内存AI处理器HBM高速网络带宽•8*100G RoCEv2高速接口,芯片间跨服务器互联时延缩短10~70%AI算力应用场景部署在数据中心机房,使能中心训练本地存储RAID支持模型训练HPC网络支持RAID 0/1/10/5/50/6/608 * 100GE1* OCP NIC 3.0标卡,支持2 * 25GE最多支持2个PCIe3.0 x16和4个PCIe3.0 x8PCIe扩展智慧城市智慧医疗电源扩展插槽4个热插拔2 kW或3 kW交流电源模块支持2+2冗余••200 ~ 240 V AC240 V DC天文探索石油勘探供电功耗散热方式风扇工作温度最大功耗5.6 kW①风冷支持8个热拔插风扇模组,支持N+1冗余5℃~35℃结构尺寸175 mm * 447 mm * 790 mm①持续调优中,数值根据调优结果动态更新构建万物互联的智能世界Atlas 900 PoD型号:9000Atlas 900 PoD(型号:9000)是基于华为昇腾910 +
鲲鹏920 处理器的AI训练集群基础单元,具有超强AI算力、更优AI能效、最佳AI拓展等特点。该基础单元广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大AI算力的领域。产品规格形态CPU47U 机柜32 * 鲲鹏920•CPU内存最多256个DDR4内存插槽,支持超强AI算力•47U 高度提供最高20.48 PFLOPS FP16超强AI算力RDIMM•单根内存条容量支持32 GB/64 GB更优AI能效•提供20.48 PFLOPS/43 kW超高能效比AI处理器HBMAI算力AI算力扩展本地存储64 * 昇腾9102048 GB最高20.48 PFLOPS FP16最大可扩展至1 EFLOPS FP16最大支持64 * 2.5英寸硬盘支持RAID 0/1••交流:6路3+3,电源:380V/32A直流:4路2+2,电源:380V/32A最佳AI拓展•支持机柜单元扩展,最大可拓展至4096颗昇腾910芯片集群,总算力达1 EFLOPS FP16应用场景RAID支持供电模型训练HPC功耗散热方式温度最大功耗43 kW液冷•工作温度:5℃~40℃智慧城市智慧医疗(符合ASHRAE Class A2/A3/A4)•2250mm×600mm×1200mm(半液冷,无风液换热器)•天文探索石油勘探结构尺寸2250mm×600mm×1250mm(半液冷,安装液冷前后门)(H*W*D)•2250mm×600mm×1350mm(全液冷,无风液换热器)•2250mm×600mm×1375mm(全液冷,安装液冷前门)构建万物互联的智能世界异构计算架构-CANNCANN(Compute Architecture for Neural Networks)是专为深度学习所设计的异构计算架构,通过各核心组件充分释放昇腾处理器澎湃算力,支持用户快速构建基于昇腾平台的AI应用和业务,主要包含AscendCL、DVPP、HCCL等组件:昇腾统一编程接口AscendCL实现软硬件解耦;华为通信集合库HCCL在分布式训练中为不同昇腾AI处理器之间提供高效的数据传输能力;DVPP实现硬件加速,提升图像预处理并行能力。使能全场景向下支持14+操作系统;底层支持10+端边云设备形态;向上能够适配多种AI框架使能极致性能亲和昇腾的极致图编译技术;丰富的高性能算子使能极简开发统一API适配全系列硬件;四大开放性设计:Plugin适配、图融合接口、Ascend-IR、算子库构建万物互联的智能世界全场景AI计算框架-MindSpore
MindSpore是新一代全场景AI计算框架,最佳匹配昇腾AI处理器算力,支持端、边、云全场景灵活部署,开创全新的AI编程范式,降低AI开发门槛,旨在实现开发态友好、运行态高效、部署态灵活三大目标,推动人工智能软硬件应用生态繁荣发展。全流程极简•••模型开发套件,“即开即用”模型调优套件,“所见即所得”第三方支持套件,“一键式转换”Cloud全自动并行••一行代码,串行算法并行化张量自动切分,最大化并行效率全场景协同•全场景自适应部署,跨异构硬件执行,无需模型转换•端侧轻量学习,模型“私人订制”构建万物互联的智能世界全流程开发工具链-MindStudioMindStudio提供了AI开发所需的一站式开发环境,支持模型开发、算子开发及应用开发的全流程任务。依靠模型可视化、算力测试、IDE本地仿真调试等功能,帮助开发者高效便捷的完成AI开发。模型开发MindStudio包含了模型开发所涉及的推理、训练全系列工具,同时支持随时调用ModelZoo中提供的大量预训练好的AI模型、模型训练脚本以及模型开发案例,让开发者能够最高效的完成AI模型的开发。算子开发MindStudio兼顾算子开发的易用性与灵活性,提供了DSL和TIK两种算子开发方式,在算子开发过程中,还提供了性能调优与精度比对等功能。TBE-DSL最优开发效率••自动实现数据切分和调度,只需关注计算表达覆盖70%算子,算子开发时间较业界降低70%••TBE-TIK最佳算子性能提供指令级编程和调优能力,需关注指令集调用过程和数据切分及编排覆盖全部算子,可以发挥芯片的极致性能应用开发通过AscendCL接口,进行系统级调优、调试传输等AI应用开发,提供模型/算子加载与执行、多种C++的API接口等功能。应用部署通过连接IP地址统一管理调试设备,实现远程管理、调试及应用推送,无缝兼容不同形态的设备。系统管理由FusionDirector及SmartKit组成的昇腾云边协同工具,可以让开发者对系统进行实时地设备管理、模型部署等操作。构建万物互联的智能世界昇腾应用使能-MindX昇腾应用使能MindX为行业应用开发者而设计,快速使能开发者进行各行业AI应用开发。MindX包含“2+1+X”,深度学习使能MindXDL 、智能边缘使能MindXEdge、1个优选模型库ModelZoo和X个行业SDK深度学习使能-MindXDL数据中心计算资源统一管理与调度,使能合作伙伴快速开发深度学习系统第三方深度学习系统ModelArts 第三方云平台计算资源最优化调度支持NPU设备发现、集合通信优化、大批量数据群组调度边云协同参考设计支持中心训练模型发布、更新、推送至边缘进行推理,形成模型的完整闭环智能边缘使能-MindXEdge轻量化的边缘计算资源管理运维,使能行业客户快速搭建边云协同推理平台边云协同设计云端模型推送至边缘快速部署边缘数据支持上传云端持续训练多样化硬件形态支持摄像头、工控机、机器人、无人机、边缘推理服务器…轻量化部署极致轻量化,平台内存开销仅256MB,CPU占用率仅3%优选模型库-ModelZoo易获取> ModelZoo为开发者提供丰富的场景化优选预训练模型,为开发者解决了模型的选型难、训练难、优化难等问题多种框架MindSpore、TensorFlow、PyTorch、Caffe等多场景OCR、图像检测、图像分类、图像分割、推荐类、NLP、机器翻译、语音生成、增强学习等高性能模型提前调优并保障精度性能构建万物互联的智能世界昇腾应用使能-MindX行业应用开发套件-MindXSDK面向行业场景的完整AI开发套件,提供极简易用的API及图形界面,使能开发者以极少代码快速开发行业AI应用管理业务流和生成推理服务。StreamManager负mxStream责业务流的构建和销毁,同时提供发送数据和获取结果的接口;StreamServer将Stream构建成推理服务,对外提供restful接口接收推理请求。mxPlugins基础功能插件,例如模型推理插件、图像解码插件昇腾芯片功能基础库:包括图像编解码、裁剪缩放,模型推理SDK提供的开发工具。其中PluginToolkit提供插件开发的APImxBasemxTools已上线昇腾社区制造mxManufacture视觉mxVision请访问昇腾社区获取更多支持构建万物互联的智能世界昇腾计算产业生态昇腾计算产业生态包括围绕着昇腾计算技术和产品体系所开展的学术、技术、公益及商业活动,产生的知识和产品以及各种合作伙伴,主要包括硬件合作伙伴、软件算法合作伙伴、初创公司、高校和业界开发者。以上共同构成了昇腾产业的合作伙伴生态体系,不同的角色相互配合,共同促进AI赋能千行百业。昇腾计算产业硬件开放,软件开源,使能合作伙伴1个创新发展的AI计算产业2大商业扶植计划3大人才培养措施昇腾使能千行百业的智能化转型助力昇腾合作伙伴商业成功昇腾万里ISV合作伙伴发展计划实现联合方案的商业成功昇腾万里初创伙伴加速计划加速初创企业的创新和成长为昇腾产业长期发展培育核心人才昇腾高校教学合作计划MindSpore论文+模型开发激励计划昇腾开发人员成长计划2大昇腾生态发展的基础平台昇腾生态创新中心昇腾开发者社区制造交通自由流收费高速视频云联网车辆稽核能源输电线路智能运检智能变电站智能营业厅智能加油站金融智慧网点金融OCR互联网精准推荐内容审核医疗肺炎诊断骨龄检测与业界TOP
ISV联合创新工业质检(烟草、半导体、PCB、线管材、镜筒)昇腾系列教材让昇腾成为昇腾AI处理器架构与编程深度学习与MindSpore实践ModelArts人工智能应用开发指南高校学生必备技能高校合作“智能基座”产教融合协同育人基地构建万物互联的智能世界