在云端运行 vLLM 服务后,可通过 SSH Tunnel 将远程 OpenAI-Compatible API 映射到本地,整个方案可作为个人 AI 基础设施的底层架构。 一、整体架构 整体架构如下: ┌─────────────────────┐ │ 本地 Cherry Studio │ └─────────┬───────────┘ │ │ OpenAI API ▼ ┌─────────────────────┐ │ localhost:8000 │ │ SSH Tunnel │ └─────────┬────…

