NVIDIA · 大模型

NVIDIA 发布 Triton 推理服务器对大语言模型的更新支持

NVIDIA 发布 Triton 推理服务器更新,新增对大语言模型的部署优化。此次更新面向生产环境,提升 LLM 推理的性能与效率,帮助开发者更便捷地在 GPU 上运行大规模语言模型。NVIDIA Triton 作为开源推理服务器,持续扩展对主流模型架构的支持。

域名
blogs.nvidia.com
评分
3 · 可关注
发布
2024-10-16
NVIDIA 发布 Triton 推理服务器对大语言模型的更新支持

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。