释放潜力:GPUStack开创大模型时代,打造开源GPU集群管理器

admin admin
1
2024-07-30
GPUStack:企业私有大语言模型集群管理器发布!7月26日,数澈软件Seal(以下简称“Seal”)宣布正式发布并开源最新产品 GPUStack,GPUStack 是一个用于运行 LLM(大型语言模型)的开源 GPU

GPUStack:企业私有大语言模型集群管理器发布!

7月26日,数澈软件Seal(以下简称“Seal”)宣布正式发布并开源最新产品 GPUStack,GPUStack 是一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。

尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使用,但对企业来说,部署托管自己私有的 LLM 供企业和组织在私有环境使用仍然非常复杂。

企业需要安装和管理复杂的集群软件,如 Kubernetes,然后还需要研究清楚如何在上层安装和管理 AI 相关的工具栈。而目前流行的能在本地环境运行 LLM 的方法,如 LMStudio 和 LocalAI,却大都只支持在单台机器上运行,而没有提供多节点复杂集群环境的支持能力。

帮助企业简单快速地开启 LLM 创新

当前,企业如果想要在 GPU 集群上托管大模型,必须要做大量的工作来集成复杂的技术栈。通过使用 GPUStack,企业不再需要担心如何管理 GPU 集群、推理引擎和推理加速、租户和配额管理、使用和计量、性能度量、统一认证授权和访问控制,以及仪表板。

如下图所示,GPUStack 是一个构建企业私有的大模型即服务(LLMaaS)的完整平台,拥有构建大模型即服务所需的各项功能。管理员可以将模型从 Hugging Face 等模型仓库部署到 GPUStack 中,然后开发人员可以连接到 GPUStack 提供的私有大模型 API,在他们的应用中集成和使用私有大模型服务。

GPUStack发布

整合GPU资源运行大模型

组建 GPU 集群整合资源

GPUStack 可以聚合集群内的所有 GPU 资源。它旨在支持所有的 GPU 厂商,包括英伟达,苹果,AMD,英特尔,高通,华为等。GPUStack 兼容运行 MacOS、Windows 和 Linux 操作系统的笔记本电脑、台式机、工作站和服务器

模型部署和推理

GPUStack 为在不同 GPU 上部署不同大模型选择最佳的推理引擎,支持的首个推理引擎是 LLaMA.cpp,其他推理引擎(如vLLM)的支持也在路线图中。

快速与现有应用集成

GPUStack 提供了与 OpenAI 兼容的 API,并提供了大模型试验场。开发人员可以调试大模型并将其快速集成到自己的应用中。此外,开发人员还可以通过观测指标来了解应用对各种大模型的使用情况。这也有助于管理员有效地管理 GPU 资源利用。

GPU 和 LLM 的观测指标

GPUStack 提供全面的性能、利用率和状态监控指标。对于 GPU,管理员可以使用 GPUStack 实时监控资源利用率和系统状态。对于 LLM,相关指标则可以帮助开发人员评估模型的性能并优化应用。

认证和访问控制

GPUStack 为企业提供身份验证和RBAC(Role-based Access Control)功能。这保证了只有授权的管理员可以部署和管理大模型,只有授权的开发人员可以使用大模型,应用也可以通过统一的 API 认证授权访问各种大模型。

加入社区,参与开源共创

GPUStack 项目正在快速迭代,计划引入对多模态模型的支持,更多的 GPU 厂商支持,以及更多的推理引擎支持。我们十分欢迎您一起参与开源项目的贡献,也欢迎在我们的 GitHub 仓库 gpustack/gpustack 上点亮 Star 关注我们的最新动态。

其他相关 RELEVANT MATERIAL
乘风时代 ·· 破浪前行:彰显外贸智能化营销的创新与增长新趋势

乘风时代 ·· 破浪前行:彰显外贸智能化营销的创新与增长新趋势

admin admin
3
2024-07-30
引言:智能化时代来临,外贸企业如何乘时代之风,破变革之浪?生成式人工智能正在引发新一轮的智能化浪潮。受益于海量的数据和强大的算力,大模型增强了人工智能的通用性,逐渐渗透到各行各业,国际贸易领域便是其中之一。面对时代的变革,外贸企业应如何在经济全球化的浪潮中,乘...

「三星Galaxy Z Flip6:AI智能引领潮流,定制个性生活轻松释放!」

admin admin
19
2024-07-26
最近,三星在国内推出了Galaxy Z Flip6,这款旗舰折叠屏手机集科技、美学、个性化和实用性于一身。Galaxy Z Flip6代表了三星在折叠屏技术上的又一次飞跃,并通过AI赋能的创新功能,成为了用户表达自我、展现个性的超能工具。外观设计上,大胆的镜头设计加上鲜明的机身配色...
鲲鹏原生开发训练营:征服技术创新时代的重磅战舰

鲲鹏原生开发训练营:征服技术创新时代的重磅战舰

admin admin
21
2024-07-26
随着生态的不断成熟,鲲鹏逐渐从迁移为主发展到原生开发阶段。与此同时,鲲鹏也面临着让开发者能够在变道后提档加速的新任务,从应用迁移走向原生开发。开发者是计算技术创新的关键力量。为了让开发者全面了解鲲鹏原生开发理论知识,掌...

佳能EOS R7配镜探索:释放无尽的创意可能

admin admin
45
2024-07-21
佳能EOS R7是一款APS-C画幅相机,拥有约3250万有效像素和高速数据读取能力的CMOS图像感应器,以及高性能的DIGIC X影像处理器。炙手可热的佳能EOS R7需要配备正确的镜头才能充分释放潜力。目前,除了RF-S和RF镜头,佳能EOS R7还支持使用EF镜...
为什么您需要升级您的CPU:AI时代的电脑性能需求

为什么您需要升级您的CPU:AI时代的电脑性能需求

admin admin
40
2024-07-20
AI大模型应用在各个行业在某三甲医院的门诊中,汇集了来自各地的病患,医生们正在以最专业的能力和最快的速度进行会诊。期间,医生与患者的对话可以通过语音识别技术被录入到病例系统中,随后大模型 AI 推理技术辅助进行智能总结和诊断,医生...

国产大模型第一梯队玩家为什么选择CPU?

admin admin
19
2024-07-20
大模型时代,CPU革新助力AI落地应用AI一天,人间一年。在当今社会,大模型的更新速度简直令人眼花缭乱——Sora、Suno、Udio、Luma……一个重磅应用接一个问世。来自InfoQ的调查数据显示,虽然AIGC目前还处于起步阶段,但市场规模已初具雏形:行业整体迅速发展固然是好事,但...
评论 SAY SOMETHING
最新评论
年度爆文