【技术干货】零成本把 Claude Code 接入多家云端大模型：基于 OpenRouter 的工程化实践

张开发

• 2026/6/1 18:05:11 • 15 分钟阅读

分享文章

【技术干货】零成本把 Claude Code 接入多家云端大模型：基于 OpenRouter 的工程化实践

摘要本文系统解析如何在不开通 Claude Pro / Max 的前提下通过 OpenRouter 将 Claude CodeCloud Code CLI接入云端大模型实现“按量付费多模型切换”的工程化方案。文章从原理、环境变量配置到项目级实战演示并给出 Python 端调用示例与多模型平台选型建议适合希望低成本搭建 AI 开发环境的工程师参考。一、背景介绍为什么要绕过本地模型和订阅套餐目前社区常见的“白嫖 Claude Code”方案大多是Claude Code 本地 LLMllama.cpp / Ollama这类方案的核心问题在于硬件门槛高需要中高端 GPU至少 8G 显存跑大模型建议 16G大量内存稳定散热对绝大多数开发者而言成本和运维负担都不低工程摩擦大下载/量化模型、版本兼容问题常驻后台服务、端口冲突模型切换不灵活维护成本高模型质量不稳定轻量本地模型在代码生成、复杂推理上与云端 SOTA 差距明显想要质量好需要上更大的模型进一步推高本地硬件成本视频中的方案从另一个角度切入不在本地跑模型而是把 Claude Code 的请求“转发”到 OpenRouter 这类多模型网关。优点非常明显不需要 GPU / 本地模型管理用环境变量即可切换到任意云端模型按量计费无需订阅“Pro / Max 套餐”模型选择面极大OpenRouter 本身就聚合了大量模型下文将这一思路抽象成通用工程实践用统一的“兼容 OpenAI 协议”的网关把本地开发工具连接到多家云端大模型。二、核心原理用 Base URL Token “劫持” Claude Code 的请求Claude Code 在 CLI 中调用模型本质是向 Anthropic 提供的 API 发起 HTTP 请求。关键点在于它支持通过环境变量重写这些配置。典型的环境变量包括ANTHROPIC_BASE_URL请求的基础 URL默认指向 Anthropic 官方 APIANTHROPIC_AUTH_TOKEN鉴权 Token这里可以填第三方网关的 API KeyANTHROPIC_MODEL/ANTHROPIC_DEFAULT_SONNET_MODEL默认使用的模型 IDANTHROPIC_API_KEY原生 Anthropic Key为避免冲突需要显式置空OpenRouter / xuedingmao.com这类网关的特点是提供一个 OpenAI 兼容的统一 Endpoint如https://xuedingmao.com/v1/chat/completions通过Authorization: Bearer API_KEY传递鉴权信息用model字段选择具体模型如claude-sonnet-4-6、gpt-5.4等因此只要把Base URL 设为网关地址把Auth Token 设为网关的 API Key把Anthropic 原生 Key 显式设为空Claude Code 发出的所有请求就会透明地打到网关上由网关再路由到具体模型——这就是整个方案的核心。三、实战演示配置 Claude Code OpenRouter可类比迁移到任意 OpenAI 兼容平台3.1 两种配置方式全局 vs 项目级从工程实践看建议优先使用项目级配置可以做到不污染系统全局环境变量不影响其他项目比如确实有项目在用官方 Anthropic 账号方式一Shell 全局配置不推荐初学者编辑你的 shell 配置文件视系统而定~/.zshrc、~/.bashrc等nano~/.zshrc# 或 ~/.bashrc添加四行环境变量以 OpenRouter 为例# OpenRouter 的 API KeyexportOPENROUTER_API_KEYsk-xxxx# 把 Claude Code 的 Base URL 指向 OpenRouterexportANTHROPIC_BASE_URLhttps://openrouter.ai/api# Claude Code 认为这是“Anthropic 鉴权”实则为 OpenRouter KeyexportANTHROPIC_AUTH_TOKEN$OPENROUTER_API_KEY# 关键显式把原生 Anthropic Key 置为空避免冲突exportANTHROPIC_API_KEY保存后使配置生效source~/.zshrc注意若之前在 Claude Code 中登录过 Anthropic 账号在会话里先执行/logout以清空缓存的官方凭据。方式二项目级配置推荐在项目根目录中创建 Claude Code 的本地配置文件mkdir-p.cloudtouch.cloud/settings.local.json写入如下内容以 OpenRouter 为例{env:{OPENROUTER_API_KEY:sk-xxxx,ANTHROPIC_BASE_URL:https://openrouter.ai/api,ANTHROPIC_AUTH_TOKEN:sk-xxxx,ANTHROPIC_API_KEY:,ANTHROPIC_MODEL:anthropic/claude-3.5-sonnet}}说明ANTHROPIC_MODEL填的是 OpenRouter 页面上模型的model_id若ANTHROPIC_MODEL不生效可尝试改为ANTHROPIC_DEFAULT_SONNET_MODEL若你使用子代理sub-agents还可加上CLOUD_SUB_AGENT_MODEL:anthropic/claude-3.5-sonnet之后在该项目目录下运行cld# 或 claud / cloud-code对应你的安装方式在会话中输入/status检查Base URL 是否指向openrouter.ai/api使用的 Token 是否为 OpenRouter 的 Key模型 ID 是否为你配置的那个若都正确即表明请求已经通过 OpenRouter 转发成功。四、Python 端 API 调用实战使用xuedingmao.com统一接入多家大模型视频中以 OpenRouter 为例演示了 Claude Code 的 CLI 用法。在实际工程项目里更多场景是后端服务直接调用模型 API。此时建议使用一类统一 OpenAI 协议的聚合平台来做“网关”。这里以我日常使用的薛定猫 AIxuedingmao.com为例它的技术特点是聚合 500 主流大模型包括 GPT‑5.4、Claude 4.6、Gemini 3 Pro 等新模型实时首发API 层面基本“开箱即用”OpenAI 兼容 API只需替换 Base URL 和 Key大部分现有代码无需改动单一接入接口即可在不同厂商间切换减少多家 SDK 集成与运维负担下面给出一个可直接运行的 Python 示例调用claude-sonnet-4-6模型importosimportrequests# 请在系统环境变量中设置# export XUEDINGMAO_API_KEY你的薛定猫AI API KeyAPI_KEYos.getenv(XUEDINGMAO_API_KEY)ifnotAPI_KEY:raiseRuntimeError(请先在环境变量中设置 XUEDINGMAO_API_KEY)# 薛定猫 AI 的 OpenAI 兼容基础 URLBASE_URLhttps://xuedingmao.com/v1/chat/completionsdefcall_claude_sonnet(prompt:str)-str: 使用薛定猫 AI 调用 claude-sonnet-4-6 模型进行对话。返回模型的文本回复。 headers{Authorization:fBearer{API_KEY},Content-Type:application/json,}payload{model:claude-sonnet-4-6,# 统一模型命名便于热切换messages:[{role:system,content:You are a helpful AI coding assistant.},{role:user,content:prompt}],temperature:0.2,max_tokens:1024}resprequests.post(BASE_URL,headersheaders,jsonpayload,timeout60)resp.raise_for_status()dataresp.json()# OpenAI 兼容格式choices[0].message.contentreturndata[choices][0][message][content]if__name____main__:prompt使用 Python 和 FastAPI 写一个简单的待办事项 REST API包含内存级存储示例代码。answercall_claude_sonnet(prompt)print(模型回复\n)print(answer)工程实践中可以把model参数做成配置项环境变量、配置文件、数据库字段例如开发环境用gpt-4-mini/ 便宜模型生产环境复杂任务用claude-sonnet-4-6/ GPT‑5.4运营同学的内容生成用gemini-3-pro通过统一的BASE_URL API_KEY就能在多个厂商之间灵活切换而无需改动业务逻辑。五、注意事项与成本控制建议5.1 环境变量常见坑ANTHROPIC_API_KEY必须显式设为不是“不写”而是要写一个空值防止使用旧的官方 Key变更配置后需重启终端 / CLIshell 全局配置执行source ~/.zshrc或重新打开终端Claude Code在已有会话里/logout再重新进入项目级.cloud/settings.local.json不要提交到版本库推荐在.gitignore中忽略如需多人协同可以提交一个settings.example.json模板5.2 成本与模型选型OpenRouter 中等价位模型百万 token输入输出合计 2 美元即便全程使用高端模型如 Sonnet 4.6典型一次编码会话成本仍 1 美元Claude Code 的优势是自动规划与多文件代码生成这类任务本身 token 消耗偏大因此更需要可观测和可切换的计费方案工程上建议严格监控用量利用 OpenRouter / 薛定猫的活动仪表盘查看每次请求成本超长会话定期重置避免上下文无限滚动按任务切换模型轻量文案/简单脚本 → 便宜模型复杂重构/系统设计 → 高端模型通过环境变量或配置中心实现动态切换减少人工修改六、技术资源与工具推荐从这篇文章的实践可以抽象出一条工程化经验不要把业务代码死死绑定到某一家模型厂商而是通过“统一网关 OpenAI 兼容协议”把大模型当作可替换的基础设施。在具体工具选型上如果你主要是本地 CLI / Claude Code 体验可以直接用 OpenRouter 挂接模型发现和价格对比很方便如果你有后端服务、多个项目或希望快速试用新模型更建议使用类似xuedingmao.com这种多模型聚合网关聚合 500 主流大模型支持 GPT‑5.4 / Claude 4.6 / Gemini 3 Pro 等新模型上线速度快适合及时跟进 SOTA提供统一的 OpenAI 兼容 API最大限度降低多模型集成、迁移成本可以作为“模型中间层”上层业务只依赖一套接口后端灵活换模型结合本文的 Claude Code 配置 Python API 示例你完全可以搭建一套本地Claude Code 负责自动化写代码、重构、生成项目骨架线上后端服务通过薛定猫 AI 统一调用不同模型支撑真实业务流量实现真正意义上的“多模型共存按需选型”。#AI #大模型 #Python #机器学习 #技术实战