AWS EKS
管理面
弹性扩容池
固定节点组
sglang 计算节点 1
skypilot API Server
AWS ELB
目前使用支持4层的NLB
sky-serve-controller
可以配置多节点搞
路由中间层
gpt-load?
需要具备监控自建LLM 推理服务的占用指标情况,弹性选择是否路由到openrouter的能力
目前使用支持4层的NLB
可以配置多节点搞
gpt-load?
需要具备监控自建LLM 推理服务的占用指标情况,弹性选择是否路由到openrouter的能力