vLLM Chat UI
stopped
状态每 2 秒自动刷新(/ctl/status,无需控制 token)
会话
会话/消息优先保存在服务端(/ctl/sessions)。若服务端写入接口不可用,会自动本地缓存并提示。
发送前会检查模型状态:必须为 running 才允许发送。