Concepts

Gateway 网关架构

最后更新：2026-01-22 概述单个长期运行的 Gateway 网关拥有所有消息平台（通过 Baileys 的 WhatsApp、通过 grammY 的 Telegram、Slack、Discord、Signal、iMessage、WebChat）。控制平面客户端（macOS 应用、CLI、Web 界面、自动化）通过配置的绑定主机（默认 127.0.0.1:18789）上的 WebSocket 连接到 Gateway 网关。节点（macOS/iOS/Android/无头设备）也通过 WebSocket 连接，但声明 role: node 并带有明确的能力/命令。每台主机一个 Gateway 网关；它是唯一打开 WhatsApp 会话的位置。 canvas 主机（默认 18793）提供智能体可编辑的 HTML 和 A2UI。组件和流程 Gateway 网关（守护进程）维护提供商连接。暴露类型化的 WS API（请求、响应、服务器推送事件）。根据 JSON Schema 验证入站帧。发出事件如 agent、chat、presence、health、heartbeat、cron。客户端（mac 应用 / CLI / web 管理）每个客户端一个 WS 连接。发送请求（health、status、send、agent、system-presence）。订阅事件（tick、agent、presence、shutdown）。节点（macOS / iOS / Android / 无头设备）以 role: node 连接到同一个 WS 服务器。在 connect 中提供设备身份；配对是基于设备的（角色为 node），批准存储在设备配对存储中。暴露命令如 canvas.*、camera.*、screen.record、location.get。协议详情： ...

Markdown 格式化

OpenClaw 通过将出站 Markdown 转换为共享的中间表示（IR），然后再渲染为特定渠道的输出来进行格式化。IR 保留源文本不变，同时携带样式/链接跨度信息，使分块和渲染在各渠道间保持一致。目标 **一致性：**一次解析，多个渲染器。 **安全分块：**在渲染前拆分文本，确保行内格式不会跨块断裂。 **渠道适配：**将同一 IR 映射到 Slack mrkdwn、Telegram HTML 和 Signal 样式范围，无需重新解析 Markdown。管道解析 Markdown -> IR IR 是纯文本加上样式跨度（粗体/斜体/删除线/代码/剧透）和链接跨度。偏移量使用 UTF-16 代码单元，以便 Signal 样式范围与其 API 对齐。仅当渠道启用了表格转换时才会解析表格。分块 IR（格式优先）分块在渲染前对 IR 文本进行操作。行内格式不会跨块拆分；跨度按块进行切片。按渠道渲染 Slack： mrkdwn 标记（粗体/斜体/删除线/代码），链接格式为 <url|label>。 Telegram： HTML 标签（<b>、<i>、<s>、<code>、<pre><code>、<a href>）。 Signal：纯文本 + text-style 范围；当标签与 URL 不同时，链接变为 label (url)。 IR 示例输入 Markdown： Hello **world** — see [docs](https://docs.openclaw.ai). IR（示意）： { "text": "Hello world — see docs.", "styles": [{ "start": 6, "end": 11, "style": "bold" }], "links": [{ "start": 19, "end": 23, "href": "https://docs.openclaw.ai" }] } 使用场景 Slack、Telegram 和 Signal 的出站适配器从 IR 进行渲染。其他渠道（WhatsApp、iMessage、Microsoft Teams、Discord）仍使用纯文本或各自的格式化规则，启用时会在分块前应用 Markdown 表格转换。表格处理 Markdown 表格在各聊天客户端中的支持并不一致。使用 markdown.tables 按渠道（和按账户）控制转换方式。 ...

OAuth

OpenClaw 支持通过 OAuth 进行"订阅认证"，适用于提供此功能的提供商（特别是 OpenAI Codex（ChatGPT OAuth））。对于 Anthropic 订阅，请使用 setup-token 流程。本页说明： OAuth 令牌交换的工作原理（PKCE）令牌存储在哪里（以及原因）如何处理多账户（配置文件 + 按会话覆盖） OpenClaw 还支持提供商插件，它们自带 OAuth 或 API 密钥流程。通过以下命令运行： openclaw models auth login --provider <id> 令牌汇聚点（为什么需要它） OAuth 提供商通常在登录/刷新流程中发放新的刷新令牌。某些提供商（或 OAuth 客户端）在为同一用户/应用发放新令牌时，可能会使旧的刷新令牌失效。实际症状：你通过 OpenClaw 和 Claude Code / Codex CLI 登录 → 其中一个稍后会随机"登出" 为减少这种情况，OpenClaw 将 auth-profiles.json 视为令牌汇聚点：运行时从同一个位置读取凭据我们可以保留多个配置文件并确定性地路由它们存储（令牌存放位置）密钥按智能体存储：认证配置文件（OAuth + API 密钥）：~/.openclaw/agents/<agentId>/agent/auth-profiles.json 运行时缓存（自动管理；请勿编辑）：~/.openclaw/agents/<agentId>/agent/auth.json 仅用于导入的旧版文件（仍然支持，但不是主存储）： ~/.openclaw/credentials/oauth.json（首次使用时导入到 auth-profiles.json）以上所有路径也遵循 $OPENCLAW_STATE_DIR（状态目录覆盖）。完整参考：/gateway/configuration Anthropic setup-token（订阅认证）在任意机器上运行 claude setup-token，然后将其粘贴到 OpenClaw 中： ...

TypeBox 作为协议的事实来源

最后更新：2026-01-10 TypeBox 是一个 TypeScript 优先的模式库。我们用它来定义 Gateway 网关 WebSocket 协议（握手、请求/响应、服务器事件）。这些模式驱动运行时验证、JSON Schema 导出和 macOS 应用的 Swift 代码生成。一个事实来源；其他一切都是生成的。如果你想了解更高层次的协议上下文，请从 Gateway 网关架构开始。心智模型（30 秒）每个 Gateway 网关 WS 消息都是以下三种帧之一： Request：{ type: "req", id, method, params } Response：{ type: "res", id, ok, payload | error } Event：{ type: "event", event, payload, seq?, stateVersion? } 第一个帧必须是 connect 请求。之后，客户端可以调用方法（例如 health、send、chat.send）并订阅事件（例如 presence、tick、agent）。连接流程（最小）： Client Gateway |---- req:connect -------->| |<---- res:hello-ok --------| |<---- event:tick ----------| |---- req:health ---------->| |<---- res:health ----------| 常用方法 + 事件： ...

上下文

“上下文"是 OpenClaw 在一次运行中发送给模型的所有内容。它受模型的上下文窗口（token 限制）约束。新手心智模型：系统提示词（OpenClaw 构建）：规则、工具、Skills 列表、时间/运行时，以及注入的工作区文件。对话历史：你的消息 + 助手在此会话中的消息。工具调用/结果 + 附件：命令输出、文件读取、图片/音频等。上下文与"记忆”不是同一回事：记忆可以存储在磁盘上并稍后重新加载；上下文是模型当前窗口内的内容。快速开始（检查上下文） /status → 快速查看"我的窗口有多满？" + 会话设置。 /context list → 注入了什么 + 大致大小（每个文件 + 总计）。 /context detail → 更深入的分解：每个文件、每个工具 schema 大小、每个 Skills 条目大小和系统提示词大小。 /usage tokens → 在正常回复后附加每次回复的使用量页脚。 /compact → 将较旧的历史总结为紧凑条目以释放窗口空间。另请参阅：斜杠命令、Token 使用与成本、压缩。示例输出数值因模型、提供商、工具策略和工作区内容而异。 /context list 🧠 Context breakdown Workspace: <workspaceDir> Bootstrap max/file: 20,000 chars Sandbox: mode=non-main sandboxed=false System prompt (run): 38,412 chars (~9,603 tok) (Project Context 23,901 chars (~5,976 tok)) Injected workspace files: - AGENTS.md: OK | raw 1,742 chars (~436 tok) | injected 1,742 chars (~436 tok) - SOUL.md: OK | raw 912 chars (~228 tok) | injected 912 chars (~228 tok) - TOOLS.md: TRUNCATED | raw 54,210 chars (~13,553 tok) | injected 20,962 chars (~5,241 tok) - IDENTITY.md: OK | raw 211 chars (~53 tok) | injected 211 chars (~53 tok) - USER.md: OK | raw 388 chars (~97 tok) | injected 388 chars (~97 tok) - HEARTBEAT.md: MISSING | raw 0 | injected 0 - BOOTSTRAP.md: OK | raw 0 chars (~0 tok) | injected 0 chars (~0 tok) Skills list (system prompt text): 2,184 chars (~546 tok) (12 skills) Tools: read, edit, write, exec, process, browser, message, sessions_send, … Tool list (system prompt text): 1,032 chars (~258 tok) Tool schemas (JSON): 31,988 chars (~7,997 tok) (counts toward context; not shown as text) Tools: (same as above) Session tokens (cached): 14,250 total / ctx=32,000 /context detail 🧠 Context breakdown (detailed) … Top skills (prompt entry size): - frontend-design: 412 chars (~103 tok) - oracle: 401 chars (~101 tok) … (+10 more skills) Top tools (schema size): - browser: 9,812 chars (~2,453 tok) - exec: 6,240 chars (~1,560 tok) … (+N more tools) 什么计入上下文窗口模型接收的所有内容都计入，包括： ...

上下文窗口与压缩

每个模型都有一个上下文窗口（可见的最大 token 数）。长时间运行的对话会累积消息和工具结果；一旦窗口空间紧张，OpenClaw 会压缩较早的历史记录以保持在限制范围内。什么是压缩压缩会将较早的对话总结为一条紧凑的摘要条目，并保持近期消息不变。摘要存储在会话历史中，因此后续请求使用的是：压缩摘要压缩点之后的近期消息压缩会持久化到会话的 JSONL 历史记录中。配置有关 agents.defaults.compaction 设置，请参阅压缩配置与模式。自动压缩（默认开启）当会话接近或超过模型的上下文窗口时，OpenClaw 会触发自动压缩，并可能使用压缩后的上下文重试原始请求。你会看到：详细模式下显示 🧹 Auto-compaction complete /status 显示 🧹 Compactions: <count> 在压缩之前，OpenClaw 可以运行一次静默记忆刷写轮次，将持久化笔记写入磁盘。详情及配置请参阅记忆。手动压缩使用 /compact（可选附带指令）强制执行一次压缩： /compact Focus on decisions and open questions 上下文窗口来源上下文窗口因模型而异。OpenClaw 使用已配置提供商目录中的模型定义来确定限制。压缩与修剪压缩：总结并持久化到 JSONL 中。会话修剪：仅裁剪旧的工具结果，在内存中按请求进行。有关修剪的详情，请参阅 /concepts/session-pruning。提示当会话感觉过时或上下文臃肿时，使用 /compact。大型工具输出已被截断；修剪可以进一步减少工具结果的堆积。如果你需要全新开始，/new 或 /reset 会启动一个新的会话 ID。

会话剪枝

会话剪枝在每次 LLM 调用之前从内存上下文中修剪旧的工具结果。它不会重写磁盘上的会话历史（*.jsonl）。运行时机当启用 mode: "cache-ttl" 且该会话的最后一次 Anthropic 调用早于 ttl 时。仅影响该请求发送给模型的消息。仅对 Anthropic API 调用（和 OpenRouter Anthropic 模型）生效。为获得最佳效果，请将 ttl 与你的模型 cacheControlTtl 匹配。剪枝后，TTL 窗口会重置，因此后续请求会保持缓存直到 ttl 再次过期。智能默认值（Anthropic） OAuth 或 setup-token 配置文件：启用 cache-ttl 剪枝并将心跳设置为 1h。 API 密钥配置文件：启用 cache-ttl 剪枝，将心跳设置为 30m，并将 Anthropic 模型的 cacheControlTtl 默认为 1h。如果你显式设置了这些值中的任何一个，OpenClaw 不会覆盖它们。改进内容（成本 + 缓存行为）为什么要剪枝： Anthropic 提示缓存仅在 TTL 内适用。如果会话空闲超过 TTL，下一个请求会重新缓存完整提示，除非你先修剪它。什么变得更便宜：剪枝减少了 TTL 过期后第一个请求的 cacheWrite 大小。为什么 TTL 重置很重要：一旦剪枝运行，缓存窗口会重置，因此后续请求可以重用新缓存的提示，而不是再次重新缓存完整历史。它不做什么：剪枝不会添加 token 或"双倍"成本；它只改变该 TTL 后第一个请求缓存的内容。可以剪枝的内容仅 toolResult 消息。用户 + 助手消息永远不会被修改。最后 keepLastAssistants 条助手消息受保护；该截止点之后的工具结果不会被剪枝。如果没有足够的助手消息来确定截止点，则跳过剪枝。包含图像块的工具结果会被跳过（永不修剪/清除）。上下文窗口估算剪枝使用估算的上下文窗口（字符 ≈ token × 4）。基础窗口按以下顺序解析： ...

会话工具

目标：小型、不易误用的工具集，使智能体能够列出会话、获取历史记录并向另一个会话发送消息。工具名称 sessions_list sessions_history sessions_send sessions_spawn 键模型主直接聊天桶始终是字面键 "main"（解析为当前智能体的主键）。群聊使用 agent:<agentId>:<channel>:group:<id> 或 agent:<agentId>:<channel>:channel:<id>（传递完整键）。定时任务使用 cron:<job.id>。 Hooks 使用 hook:<uuid>，除非明确设置。 Node 会话使用 node-<nodeId>，除非明确设置。 global 和 unknown 是保留值，永远不会被列出。如果 session.scope = "global"，我们会将其别名为 main 用于所有工具，这样调用者永远不会看到 global。 sessions_list 将会话列为行数组。参数： kinds?: string[] 过滤器："main" | "group" | "cron" | "hook" | "node" | "other" 中的任意一个 limit?: number 最大行数（默认：服务器默认值，限制如 200） activeMinutes?: number 仅在 N 分钟内更新的会话 messageLimit?: number 0 = 无消息（默认 0）；>0 = 包含最后 N 条消息行为： messageLimit > 0 获取每个会话的 chat.history 并包含最后 N 条消息。工具结果在列表输出中被过滤；使用 sessions_history 获取工具消息。在沙箱隔离的智能体会话中运行时，会话工具默认为仅生成的可见性（见下文）。行结构（JSON）： ...

会话管理

OpenClaw 将每个智能体的一个直接聊天会话视为主会话。直接聊天折叠为 agent:<agentId>:<mainKey>（默认 main），而群组/频道聊天获得各自的键。session.mainKey 会被遵循。使用 session.dmScope 控制私信如何分组： main（默认）：所有私信共享主会话以保持连续性。 per-peer：跨渠道按发送者 ID 隔离。 per-channel-peer：按渠道 + 发送者隔离（推荐用于多用户收件箱）。 per-account-channel-peer：按账户 + 渠道 + 发送者隔离（推荐用于多账户收件箱）。使用 session.identityLinks 将带提供商前缀的对等 ID 映射到规范身份，这样在使用 per-peer、per-channel-peer 或 per-account-channel-peer 时，同一个人可以跨渠道共享私信会话。 Gateway 网关是唯一数据源所有会话状态都由 Gateway 网关拥有（“主” OpenClaw）。UI 客户端（macOS 应用、WebChat 等）必须向 Gateway 网关查询会话列表和令牌计数，而不是读取本地文件。在远程模式下，你关心的会话存储位于远程 Gateway 网关主机上，而不是你的 Mac 上。 UI 中显示的令牌计数来自 Gateway 网关的存储字段（inputTokens、outputTokens、totalTokens、contextTokens）。客户端不会解析 JSONL 对话记录来"修正"总数。状态存储位置在 Gateway 网关主机上：存储文件：~/.openclaw/agents/<agentId>/sessions/sessions.json（每个智能体）。对话记录：~/.openclaw/agents/<agentId>/sessions/<SessionId>.jsonl（Telegram 话题会话使用 .../<SessionId>-topic-<threadId>.jsonl）。存储是一个映射 sessionKey -> { sessionId, updatedAt, ... }。删除条目是安全的；它们会按需重新创建。群组条目可能包含 displayName、channel、subject、room 和 space 以在 UI 中标记会话。会话条目包含 origin 元数据（标签 + 路由提示），以便 UI 可以解释会话的来源。 OpenClaw 不读取旧版 Pi/Tau 会话文件夹。会话修剪默认情况下，OpenClaw 在 LLM 调用之前从内存上下文中修剪旧的工具结果。这不会重写 JSONL 历史记录。参见 /concepts/session-pruning。 ...

使用量跟踪

功能简介直接从提供商的使用量端点拉取使用量/配额数据。不提供估算费用；仅展示提供商报告的时间窗口数据。展示位置聊天中的 /status：包含会话 token 数和估算费用的表情符号丰富的状态卡片（仅限 API 密钥）。当可用时，会显示当前模型提供商的使用量。聊天中的 /usage off|tokens|full：每次响应的使用量页脚（OAuth 仅显示 token 数）。聊天中的 /usage cost：从 OpenClaw 会话日志汇总的本地费用摘要。 CLI：openclaw status --usage 打印完整的按提供商分类的详细信息。 CLI：openclaw channels list 在提供商配置旁打印相同的使用量快照（使用 --no-usage 跳过）。 macOS 菜单栏：上下文菜单下的"使用量"部分（仅在可用时显示）。提供商及凭据 Anthropic (Claude)：认证配置中的 OAuth 令牌。 GitHub Copilot：认证配置中的 OAuth 令牌。 Gemini CLI：认证配置中的 OAuth 令牌。 Antigravity：认证配置中的 OAuth 令牌。 OpenAI Codex：认证配置中的 OAuth 令牌（存在时使用 accountId）。 MiniMax：API 密钥（编程计划密钥；MINIMAX_CODE_PLAN_KEY 或 MINIMAX_API_KEY）；使用 5 小时编程计划时间窗口。 z.ai：通过环境变量/配置/认证存储提供的 API 密钥。如果没有匹配的 OAuth/API 凭据，使用量信息将被隐藏。