vLLM Chat UI
stopped
—
状态每 2 秒自动刷新(/ctl/status,无需控制 token)
模型控制
会话
+
⤓
会话/消息优先保存在
服务端
(/ctl/sessions)。若服务端写入接口不可用,会自动本地缓存并提示。
聊天
模型控制
设置
加载模型
清空本会话
发送
发送前会检查模型状态:必须为
running
才允许发送。
模型控制
写操作需要 Controller Token(/ctl/start /ctl/stop /ctl/restart /ctl/logs)。
状态/会话当前不鉴权(/ctl/status /ctl/sessions*)。
查看日志
手动刷新状态
Controller Base
Controller Token
阻塞模式
wait=1(阻塞直到完成)
wait=0(后台执行)
超时(秒)
启动
停止
重启
正在执行操作中…
控制台输出(/ctl/logs?tail=200)
设置
API Base 为空表示同域(推荐)。Token 仅保存在你浏览器(可选择记住)。
API Base URL
API Token
记住 Token
否(刷新后不保留)
是(仅本浏览器 localStorage)
保存设置
重置设置