李锋镝的博客

  • 首页
  • 时间轴
  • 左邻右舍
  • 关于我
    • 关于我
    • 另一个网站
    • 我的导航站
    • 网站地图
    • 赞助
    • 博友圈
  • 说说
  • 走心评论
  • 互动榜
  • 留言
  • 🚇开往
Destiny
自是人生长恨水长东
  1. 首页
  2. AI
  3. 正文

LiteLLM 本地代理搭建

2026年6月16日 194点热度 1人点赞 2条评论

目的

把多个 LLM 供应商(AWS Bedrock 的 Anthropic 模型、DeepSeek 等)聚合成一个本地端点,Claude Code 只需配一个 ANTHROPIC_BASE_URL 就能访问所有模型。后续可按需快速切换模型负责不同的工作

  • 专才专用:收集信息、生成代码等大吞吐量阶段用 DeepSeek;方案设计、深度推理阶段用 Claude Opus,各阶段用最合适的模型。

  • 无缝衔接:同一个会话中用 /model 切换,前一个模型的输出自动成为下一个模型的输入,零搬运。

  • 降本增效:大量消耗 Token 的环节用低成本模型,复杂决策环节用顶级模型,整体又快又省钱。

示范工作流

  1. 启动会话:以低成本模型(如 DeepSeek)开始,执行信息收集、代码扫描等大上下文任务。

  2. 内联切换:使用 /model 命令无缝切换到强推理模型(如 Claude Opus),基于已有上下文进行方案设计。

  3. 接力执行:确认方案后再次切回低成本模型,完成代码生成、测试编写等批量工作。

  4. 全流程上下文自动延续:无需手动传递中间结果,对话历史随切换自动加载。

1. 安装 LiteLLM

前置:安装 uv

curl -LsSf https://astral.sh/uv/install.sh | sh

重启 shell 后验证:

uv --version

安装 LiteLLM

uv tool install 'litellm[proxy]'

二进制在 ~/.local/bin/litellm,确保它在 PATH 里(~/.local/bin 一般在 shell 启动时自动加入)。

常用操作:

which litellm           # 确认安装位置
litellm --version
uv tool upgrade litellm # 升级
uv tool uninstall litellm

2. 目录布局

~/.claude/litellm/
  config.yaml          # 模型路由 + 凭据(核心配置文件)
  litellm-startup      # 前台启动脚本

~/Library/LaunchAgents/
  com.user.litellm.plist   # macOS 开机自启 + 崩溃重拉

3. 核心配置文件\config.yaml\

LiteLLM 在 http://localhost:4000 暴露 Anthropic 协议端点,将收到的模型名路由到真实上游。替换 <YOUR_*> 占位符:

model_list:

  # ========== Bedrock: Anthropic 模型 ==========
  # 每条复用同一套 aws_bearer_token + us-east-1

  - model_name: claude-opus-4-7
    litellm_params:
      model: bedrock/global.anthropic.claude-opus-4-7
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  - model_name: "claude-opus-4-7[1m]"
    litellm_params:
      model: bedrock/global.anthropic.claude-opus-4-7
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  - model_name: claude-opus-4-8
    litellm_params:
      model: bedrock/global.anthropic.claude-opus-4-8
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  - model_name: "claude-opus-4-8[1m]"
    litellm_params:
      model: bedrock/global.anthropic.claude-opus-4-8
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  - model_name: claude-sonnet-4-6
    litellm_params:
      model: bedrock/global.anthropic.claude-sonnet-4-6
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  - model_name: claude-opus-4-5
    litellm_params:
      model: bedrock/global.anthropic.claude-opus-4-5-20251101-v1:0
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  - model_name: claude-haiku-4-5
    litellm_params:
      model: bedrock/global.anthropic.claude-haiku-4-5-20251001-v1:0
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  - model_name: claude-sonnet-4-5
    litellm_params:
      model: bedrock/global.anthropic.claude-sonnet-4-5-20250929-v1:0
      aws_bearer_token: <YOUR_AWS_BEARER_TOKEN>
      aws_region_name: us-east-1

  # ========== DeepSeek(Anthropic 兼容端点)==========
  # model_name 加 anthropic. 前缀是因为 Claude Code 选择器只接受
  # /^(claude|anthropic)/i 开头的 id,不带前缀会被静默丢弃

  - model_name: anthropic.deepseek-v4-pro
    litellm_params:
      model: anthropic/deepseek-v4-pro
      api_base: https://api.deepseek.com/anthropic
      api_key: <YOUR_DEEPSEEK_API_KEY>

  - model_name: anthropic.deepseek-v4-flash
    litellm_params:
      model: anthropic/deepseek-v4-flash
      api_base: https://api.deepseek.com/anthropic
      api_key: <YOUR_DEEPSEEK_API_KEY>

litellm_settings:
  drop_params: true       # 不同上游不支持的参数自动丢弃
  set_verbose: false

general_settings:
  master_key: null        # 本地使用,不需鉴权

配置要点

  • model_name:对外暴露的名字,Claude Code/VSCode 看到的就是它。

  • litellm_params.model:上游真实模型名。Bedrock 用 bedrock/<inference-profile-id>;DeepSeek 用 anthropic/<上游模型名>。

4. 启动脚本\litellm-startup\

#!/usr/bin/env bash
set -euo pipefail

SCRIPT_DIR="$(cd "$(dirname "$0")" && pwd)"

exec litellm \
  --config "$SCRIPT_DIR/config.yaml" \
  --port 4000 \
  --host 127.0.0.1
chmod +x ~/.claude/litellm/litellm-startup

前台启动:

~/.claude/litellm/litellm-startup

Ctrl+C 停止。监听 127.0.0.1:4000(仅本机)。

5. macOS 开机自启(LaunchAgent)

创建 ~/Library/LaunchAgents/com.user.litellm.plist(替换 <YOUR_HOME> 和 <YOUR_AWS_BEARER_TOKEN>):

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN"
  "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
<plist version="1.0">
<dict>
    <key>Label</key>
    <string>com.user.litellm</string>

    <key>ProgramArguments</key>
    <array>
        <string>/Users/<YOUR_HOME>/.claude/litellm/litellm-startup</string>
    </array>

    <key>EnvironmentVariables</key>
    <dict>
        <key>AWS_BEARER_TOKEN_BEDROCK</key>
        <string><YOUR_AWS_BEARER_TOKEN></string>
        <key>PATH</key>
        <string>/Users/<YOUR_HOME>/.local/bin:/opt/homebrew/bin:/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin</string>
    </dict>

    <key>WorkingDirectory</key>
    <string>/Users/<YOUR_HOME>/.claude/litellm</string>

    <key>RunAtLoad</key>
    <true/>

    <key>KeepAlive</key>
    <true/>

    <key>ThrottleInterval</key>
    <integer>30</integer>

    <key>ProcessType</key>
    <string>Background</string>

    <key>StandardOutPath</key>
    <string>/tmp/litellm.log</string>

    <key>StandardErrorPath</key>
    <string>/tmp/litellm.log</string>
</dict>
</plist>

验证语法:

plutil -lint ~/Library/LaunchAgents/com.user.litellm.plist

加载:

launchctl bootstrap gui/$(id -u) ~/Library/LaunchAgents/com.user.litellm.plist

日常运维:

# 状态
launchctl print gui/$(id -u)/com.user.litellm | grep -E 'state|pid|last exit'

# 重启(改完 config.yaml、不改 plist)
launchctl kickstart -k gui/$(id -u)/com.user.litellm

# 改完 plist(如轮换凭据)必须 bootout + bootstrap
launchctl bootout gui/$(id -u)/com.user.litellm
plutil -replace EnvironmentVariables.AWS_BEARER_TOKEN_BEDROCK -string '<新token>' ~/Library/LaunchAgents/com.user.litellm.plist
launchctl bootstrap gui/$(id -u) ~/Library/LaunchAgents/com.user.litellm.plist

# 卸载
launchctl bootout gui/$(id -u)/com.user.litellm

# 日志
tail -f /tmp/litellm.log

6. Claude Code 接入 Settings

~/.claude/settings.json 的 env 段(其余 permissions/hooks/theme 按原有设置):

"env": {
  "ANTHROPIC_BASE_URL": "http://localhost:4000",
  "ANTHROPIC_AUTH_TOKEN": "sk-litellm-local-noauth",
  "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY": "1",
  "ANTHROPIC_MODEL": "anthropic.deepseek-v4-pro[1m]",
  "ANTHROPIC_SMALL_FAST_MODEL": "anthropic.deepseek-v4-flash"
}

字段说明

  • ANTHROPIC_BASE_URL:指向 LiteLLM。

  • ANTHROPIC_AUTH_TOKEN:占位值,LiteLLM 不校验但 SDK 要求非空。

  • CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY:必须为 "1",否则选择器不读网关模型。

  • ANTHROPIC_MODEL:默认大模型(末尾 [1m] 开 1M 上下文)

  • ANTHROPIC_SMALL_FAST_MODEL:默认小模型。

改完后必须重启 Claude Code(\Cmd+Shift+P\ → \Developer: Reload Window\,或 CLI \Ctrl+C\ 重开)。

⚠️ 如果之前通过 \~/.zshrc、\~/bash_rc、\~/.bash_profile 等设了 \ANTHROPIC\_BASE\_URL\ / \ANTHROPIC\_MODEL\ 等环境变量,这些会覆盖 \settings.json\ 的 \env\ 段。用 \env | grep ANTHROPIC\ 检查,有残留就从 Shell 配置文件中注掉

7. 验证

确认 LiteLLM 已启动:

curl -s http://localhost:4000/health/liveliness

列出所有模型:

curl -s http://localhost:4000/v1/models | python3 -c "import sys,json; [print(x['id']) for x in json.load(sys.stdin)['data']]"

一条请求验证路由:

curl -sS http://localhost:4000/v1/messages \
  -H 'content-type: application/json' \
  -H 'anthropic-version: 2023-06-01' \
  -H 'x-api-key: x' \
  -d '{"model":"claude-haiku-4-5","max_tokens":8,"messages":[{"role":"user","content":"ping"}]}'

8. 凭据轮换

  • Bedrock token 过期 → 改 plist 的 EnvironmentVariables.AWS_BEARER_TOKEN_BEDROCK + yaml 兜底,bootout + bootstrap 重载。

  • DeepSeek key 过期 → 改 yaml 的 api_key,kickstart -k 重载。

除非注明,否则均为李锋镝的博客原创文章,转载必须以链接形式标明本文链接

本文链接:https://www.lifengdi.com/ren-gong-zhi-neng/4732

相关文章

  • codebase-memory-mcp 极简完整使用指南
  • Claude Haiku 4.5、Claude Sonnet 4.6、Claude Opus 4.7 区别以及各自的新特性
  • Everything Claude Code 详细使用文档
  • Claude Code全维度实战指南:从入门到精通,解锁AI编程新范式
  • AI重构开发者工作范式:从Anthropic内部调研看Claude对研发领域的深层影响
本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可
标签: Anthropic Claude Code DeepSeek LiteLLM
最后更新:2026年6月16日

李锋镝

既然选择了远方,便只顾风雨兼程。

打赏 点赞
< 上一篇
1234567891112131415161718192021222324252627282930313233343536373839404142434446474849505152535455575859606162636465666769727476777879808182858687909293949596979899
取消回复
…

文章评论

  • liudonLv 1

    模型切换是要手动操作吗?

    iOSSafari 27.0 中国-北京市
    2026年6月18日
    回复
    • 李锋镝管理

      @liudon 是的

      macOSChrome 149.0.0.0 中国-北京市
      2026年6月18日
      回复
  • 秋天是倒放的春天,晚安是爱你的序篇。

    那年今日(07月03日)

    • 2005年:西班牙正式通过同性婚姻相关法案
    • 1969年:英国滚石乐队的创始团员布莱恩·琼斯去世
    • 1876年:中国第一条铁路淞沪铁路正式通车运营
    • 1518年:中国明代医学家兼药物学家李时珍出生
    • 1062年:中国北宋官员包拯去世
    • 更多历史事件
    最新 热点 随机
    最新 热点 随机
    Kratos+主题新功能预览及功能演示 SpringBoot DeferredLog 完整详解 LiteLLM 本地代理搭建 Claude-HUD 使用文档 Kratos+ —— Kratos 主题二次开发记录 译文:如何将单体应用拆解为微服务
    AI时代,个人技术博客的出路在哪里?这个域名注册整整十年了,十年时间,真快啊WordPress实现用户评论等级排行榜插件WordPress网站换了个字体,差点儿把样式换崩了做了一个WordPress文章热力图插件千万级大表新增字段实战指南:告别锁表与业务中断
    Auld Lang Syne 缓存架构实战指南:6大核心缓存技术深度解析与落地方案 阿里巴巴的26款超神Java开源项目 Claude Code全维度实战指南:从入门到精通,解锁AI编程新范式 岁末 海琴烟~~~
    最近评论
    李锋镝 发布于 4 天前(06月30日) 目前是每天一换,一个星期不重样 :41:
    不凡 发布于 4 天前(06月29日) 主题配色挺好看。 :2:
    李锋镝 发布于 5 天前(06月29日) 已经更新了~
    懋和道人 发布于 5 天前(06月29日) 境外与附件不能访问,其他都是正常的,如果不正常可以通过更换ip访问。
    李锋镝 发布于 5 天前(06月29日) 403呀道长
    标签聚合
    SQL 多线程 日常 IDEA 数据库 ElasticSearch Spring AI编程 JVM JAVA SpringBoot MCP 分布式 MySQL docker AI 架构 K8s Redis WordPress
    友情链接
    • Blogs·CN
    • Honesty
    • Mr.Sun的博客
    • 临窗旋墨
    • 哥斯拉
    • 彬红茶日记
    • 志文工作室
    • 懋和道人
    • 拾趣博客导航
    • 搬砖日记
    • 旧时繁华
    • 林羽凡
    • 瓦匠个人小站
    • 皮皮社
    • 知向前端
    • 蜗牛工作室
    • 韩小韩博客
    • 风渡言

    COPYRIGHT © 2026 lifengdi.com. ALL RIGHTS RESERVED.

    域名年龄

    Theme Kratos+ By Dylan Li

    津ICP备2024022503号-3

    京公网安备11011502039375号