请教如何管理 lambdalabs gpu 集群

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 588 天前的主题，其中的信息可能已经有所发展或是发生改变。

请教各位技术大佬，数百台 lambdalabs GPU 服务器如何管理？想接入到 k8s 里做调度/扩缩容。发现 lambdalabs 没有 vpc 的概念。我理解 k8s 控制平面一般是放在内网里。没有 vpc 的话，各个组件的通信放在公网上有些不妥。另外：在大模型环境下，容器基础镜像都比较大，小则几十 G ，也有上百 G 的情况。这块有何最佳实践分享？各位大佬请指教，感谢。

目前尚无回复

lambdalabs k8s vpc