浪潮人工智能开发平台AIStation，支持AI训练与推理一站式交付

2020-10-27 22:09:24

来源
新浪科技

AIStaion推理平台具有一键部署、快速响应、日志监控、资源管控、数据处理等功能，功能全面强大的AI资源平台。

当前，AI模型开发进入到生产部署阶段面临着多重困难和挑战：AI模型需要经过大量的调试和测试才能部署上线，这一过程通常需要2-3天;AI线上服务计算资源一般较固定，对于突发需求资源响应慢，业务扩展难;AI模型来源不同，统一管理也很困难。企业希望可以无缝衔接AI模型训练开发与推理部署，进行高效的资源调度和模型管理，缩短业务上线周期。浪潮人工智能开发平台AIStation，可以助力企业更好应对以上挑战。

AIStation的浪潮专为企业级AI生产环境打造的人工智能开发平台。之前浪潮AIStation训练平台通过计算资源细粒度调度、训练数据缓存加速、分布式训练自动编排等策略，使用户的AI计算资源利用率提高到90%以上，大幅缩短了模型开发周期，已经获得广泛应用。

在今年4月9日举行的2020浪潮云数据中心合作伙伴大会期间，浪潮发布最新的AIStation推理平台，可实现推理服务资源敏捷调配，支持多源模型统一调度，使模型部署从几天缩短到几分钟，将有力地帮助企业轻松部署AI推理服务，从而大幅提升AI交付和生产效率。随着本次浪潮AIStation推理平台的面世，AIStation资源平台全面支持训练与推理两大场景，实现从模型开发、训练、部署、测试、发布、服务的全流程一站式高效交付。

最新发布的浪潮AIStation推理平台是企业级AI推理服务平台，通过弹性可伸缩架构、低延迟轻量化设计、A/B测试滚动发布、多模型加权评估等重要技术创新，帮助企业高效利用AI计算资源，快速部署推理服务。AIStaion推理平台具有一键部署、快速响应、日志监控、资源管控、数据处理等功能，功能全面强大的AI资源平台。

AIStation推理平台支持本地On-Premise和云端Cloud部署，保证服务的可获得性和业务连续性，实现了AI模型从开发环境到生产部署繁杂过程的自动化快捷操作，将模型部署时间从两三天降低到几分钟。

在资源调度方面，AIStation推理平台能够敏捷调配服务资源。采用创新的弹性可伸缩架构，可根据推理服务资源需求的变化及时调整资源配给，将响应突发需求的实例部署时间从几小时缩短到几分钟。并且支持新模型发布前A/B测试，在实际业务场景中验证模型有效性，保证推理业务的安全、可靠，同时避免了流量切换所导致的集群负载压力。

在模型管理方面，AIStation推理平台实现了多源模型统一调度。通过统一平台管理多源、多场景模型的推理服务，实时掌控全局资源，对模型服务实现综合调度和动态部署。同一资源池可同时支持多家模型服务，将资源利用率从40% 提高到80%。并且可实现多模型加权评估，通过对不同预训练模型的计算结果进行自定义权值设置，有效提升实际业务场景中预测结果的可靠性，构建可靠可信的智能系统，有效降低误判率。

浪潮AI&HPC总经理刘军表示：“智算中心是人工智能新基建，它生产和供应人工智能计算力，是社会经济运行的智慧基础设施。而要让智算中心充分释放算力，就需要按需灵活调度算力。AIStation对于智算中心新基建的意义，就相当于电厂和电网的核心调度系统，它能够根据AI应用需求高效调度AI算力资源，帮助企业加速AI研发创新、提速AI生产交付，让企业更专注于AI开发本身，从而赋力更多创新可能，加速AI落地应用。”

浪潮是人工智能计算的领导品牌，AI服务器中国市场份额保持50%以上，并与人工智能领先科技公司保持在系统与应用方面的深入紧密合作，帮助AI客户在语音、语义、图像、视频、搜索、网络等方面取得数量级的应用性能提升。浪潮与合作伙伴共建元脑生态，共享AI计算、资源与算法三大核心平台能力，助力行业用户开发并部署属于自己的“行业大脑”，加速推进产业AI化落地。

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

浪潮人工智能开发平台AIStation，支持AI训练与推理一站式交付

打工不易，摸鱼不行！AI化身监工，上班摸鱼全被记录

智能建筑能源管理系统的趋势、挑战和未来

成本可降40％!亚马逊发布用于神经网络训练的超高效人工智能实例预览

图像识别技术原理及应用分析

人工智能发展需要“以人为本”

N2W 宣布为 Kubernetes 提供下一级别自动备份与恢复功能

Cloudflare 3周2宕，宕机事件暴露了人工智能和支付依赖的风险

嵌入式安全：嵌入式系统制造商如何通过安全启动密钥管理加强保护

X平台发布全新“Chat”功能，新增端到端加密与视频通话

PostgreSQL 数据库开源接口 pgAdmin4 中发现严重的远程代码执行（RCE）漏洞

Wasabi 推出隐蔽复制功能，提升云存储安全，防勒索软件

HostColor 在迈阿密数据中心推出新的 AI 兼容云和裸机服务器

Inveniam 收购 Storj 为去中心化数据基础设施的未来提供动力

Smash 专为创意社区设计的新服务取代传统文件传输

ASI Solutions 推出 InfiniStor 云存储平台

我国科学家在量子体系中实现突破商业化落地迎关键拐点

江门中微子实验精度提高1.5~1.8倍

2030 年比特币会被量子计算机攻破吗？

NODKA IPC-615H5-Q670利用英特尔的处理和工具集提高性能

LDRA 宣布其 LDRA 工具套件现在支持对多核架构上的时序耦合干扰的增强分析

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

美光战略调整，彻底退出消费级内存市场，2026年起停售DDR内存和SSD

电源和冷却限制是未来三到五年人工智能数据中心增长的重大障碍

慧荣科技宣布推出SM8388，业界领先的高能效PCIe Gen5企业SSD主控芯片

Supercomputing 2025：西部数据将展示创新的下一代AI存储

天硕工业级宽温存储方案：智能SLC模式助力关键领域国产化替代

为AI时代打造的 Pure Storage平台，让数据更智能、更快、更安全、更有趣

和硕通过先进的 OCP 解决方案为数据中心的未来提供动力

江苏:县级以下禁止开发政务服务APP

瑞金医院联合华为开源RuiPath病理模型，加速行业智能化落地

科技要闻

Microchip推出数字功率监测器，实现便携式设备测量功耗减半

全球半导体设备市场统计报告：出货量330亿美元，中国占额最大

CISP认证全面介绍，CISP报名条件及培训课程介绍

芯展速“臻·6”发布会圆满礼成国内首发Gen6路标加速「多模态」真正落地

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

浪潮人工智能开发平台AIStation，支持AI训练与推理一站式交付

猜你喜欢

科技要闻