李锋镝的博客

  • 首页
  • 时间轴
  • 评论区显眼包🔥
  • 左邻右舍
  • 博友圈
  • 关于我
    • 关于我
    • 另一个网站
    • 我的导航站
    • 网站地图
    • 赞助
  • 留言
  • 🚇开往
Destiny
自是人生长恨水长东
  1. 首页
  2. AI
  3. 正文

一文吃透 AI 核心技术栈:AIGC、RAG、Function Call、Agent、MCP 关系与演进全解析

2025年11月10日 296点热度 0人点赞 0条评论

AI 领域的热词层出不穷,AIGC、RAG、Function Call、Agent、MCP 常常被混为一谈——很多人知道它们是 AI 应用的关键技术,却搞不清彼此的依赖关系、适用场景和技术边界。

实际上,这些技术并非孤立存在,而是一条清晰的“能力演进链”:AIGC 是基础(生成内容),RAG 和 Function Call 是能力补充(解决实时性和工具使用),Agent 是进阶(实现自主任务闭环),MCP 是生态基石(标准化工具接入)。本文将从技术原理、应用场景、实战案例、演进逻辑四个维度,详细拆解每个概念,帮你彻底理清 AI 技术栈的核心逻辑。

一、AIGC:AI 技术栈的“基础生成能力”

AIGC 是整个技术栈的起点,所有后续技术都是为了弥补其不足、扩展其能力——它解决了“AI 能生成内容”的核心问题。

1. 核心定义与技术原理

AIGC(AI Generated Content,AI 生成内容),指通过 AI 模型自动生成人类可理解、可使用的内容,核心是“从无到有”的创造能力。

  • 技术基石:基于 Transformer 架构的生成式模型,通过学习海量数据的模式(语言、图像、视频等),生成符合逻辑和场景的新内容;
  • 核心特性:无监督/半监督学习,无需人工标注大量数据,即可生成多样化内容;
  • 从单模态到多模态:
    • 单模态:早期模型仅支持单一内容类型(GPT-3 只能处理文字、Stable Diffusion 只能生成图像);
    • 多模态:现代模型支持跨类型内容生成(文生图、图生文、图文生视频、语音生文字等),典型代表如 GPT-4V、Claude 3 Opus、Sora、Qwen-VL。

2. 典型模型与应用场景

内容类型 典型模型 应用场景
文字生成 GPT-4、Claude 3、Qwen 内容创作(文章、周报)、代码生成、问答助手
图像生成 Stable Diffusion、Midjourney 设计(海报、LOGO)、插画、虚拟场景生成
视频生成 Sora、Runway Gen-2 短视频创作、广告片、虚拟人直播
语音生成 ElevenLabs、阿里云语音合成 语音播报、虚拟人语音、有声书制作
多模态生成 GPT-4V、Claude 3 Opus 图文问答、图像分析、跨模态内容创作

3. AIGC 的固有局限性(催生后续技术)

AIGC 虽然强大,但存在两个无法回避的硬伤,这也是 RAG 和 Function Call 诞生的原因:

  • 缺乏实时性:模型的知识库依赖训练数据,无法获取训练数据之后的新信息(如 GPT-3 训练到 2021 年,无法回答 2025 年的新闻);
  • 没有“动手能力”:只能生成内容,无法调用外部工具(如查询天气、订机票、操作数据库);
  • 事实性错误(幻觉):生成内容可能存在虚假信息,尤其是涉及专业知识或实时数据时。

二、RAG:给 AIGC 装上“实时知识库”

RAG(Retrieval-Augmented Generation,检索增强生成)的核心目标是解决 AIGC“知识过时”和“事实性错误”的问题——让模型在生成内容前,先从外部知识库检索最新、最准确的信息,再结合检索结果生成回复。

1. 技术原理与架构

RAG 不是单一技术,而是一套“检索+生成”的协同架构,核心组件包括 4 部分:

  • 知识库:存储结构化/非结构化数据(文档、网页、数据库等),支持快速检索(如企业内部文档、实时新闻、专业知识库);
  • 检索器(Retriever):接收用户查询,从知识库中检索相关信息,核心是“精准匹配”(常用技术:关键词检索、向量检索、语义检索);
  • 重排模块(Reranker):对检索结果排序,筛选最相关的Top N 信息,减少冗余;
  • 生成器(Generator):将用户查询+检索到的上下文信息结合,生成最终回复(依赖 AIGC 模型)。

2. 完整工作流程

  1. 用户输入查询(如“2025 年特斯拉全球裁员多少人?”);
  2. 检索器解析查询,从知识库(如实时新闻数据库、企业财报)中检索相关信息;
  3. 重排模块筛选出最相关的 3-5 条信息(如特斯拉 2025 年裁员公告、权威媒体报道);
  4. 生成器将“用户查询+检索到的实时信息”作为上下文,生成准确回复;
  5. 若检索结果不足,生成器会提示“无法获取相关信息”,避免幻觉。

3. 适用场景与实战案例

  • 企业知识库问答:员工查询内部文档(如 HR 政策、技术手册),RAG 检索相关文档并生成答案;
  • 实时信息查询:新闻摘要、股票行情、天气预告、体育赛事结果;
  • 专业领域问答:医疗咨询(检索最新诊疗指南)、法律问答(检索最新法规)、教育辅导(检索教材知识点)。

实战案例:企业内部文档问答系统

  • 知识库:存储公司近 3 年的技术文档、产品手册、HR 政策;
  • 检索工具:Elasticsearch(关键词检索)+ Milvus(向量检索);
  • 生成模型:Qwen-7B;
  • 效果:员工提问“如何申请带薪年假?”,RAG 检索 HR 政策文档,生成步骤清晰的回复,无需人工整理。

4. 常见工具与优化技巧

  • 核心工具:LangChain(RAG 框架)、LlamaIndex(文档处理)、Elasticsearch/Milvus(检索引擎)、Chroma(轻量向量数据库);
  • 优化技巧:
    • 知识库定期更新(增量同步新文档);
    • 采用“关键词检索+向量检索”混合模式,提升检索精度;
    • 限制检索结果数量(3-5 条),避免上下文过载。

三、Function Call:给 AIGC 配上“动手能力”

如果说 RAG 解决了“AIGC 不知道”的问题,Function Call(函数调用)则解决了“AIGC 做不到”的问题——让模型能够调用外部函数、API 或工具,将“生成内容”升级为“执行任务”。

1. 技术原理与核心逻辑

Function Call 的本质是:模型理解用户指令后,自动判断是否需要调用外部工具,生成符合规范的函数调用格式(含函数名、参数),执行后将结果返回给模型,最终生成自然语言回复。

  • 核心前提:需要提前定义函数的“元信息”(函数名、描述、参数类型、必填项),让模型理解函数的用途和调用方式;
  • 技术关键:模型具备“意图识别”和“参数提取”能力——能判断用户指令需要调用哪个函数,并从指令中提取正确参数;
  • 支持模型:GPT-4/3.5-turbo、Claude 3、Qwen、DeepSeek、Llama 3 等。

2. 完整工作流程

  1. 开发者定义函数(如 get_weather(city: str, date: str) -> str,查询指定城市指定日期的天气);
  2. 用户输入指令(如“查一下 2025 年 10 月 1 日上海的天气”);
  3. 模型解析指令:识别需要调用 get_weather 函数,提取参数 city="上海"、date="2025-10-01";
  4. 模型生成函数调用格式(如 JSON),发送给执行模块;
  5. 执行模块调用天气 API,获取结果(如“2025 年 10 月 1 日上海小雨,22-28℃”);
  6. 模型接收结果,生成自然语言回复(如“2025 年 10 月 1 日上海有小雨,气温 22-28℃,建议带伞”)。

3. 函数定义规范与示例

函数定义必须清晰,包含“描述+参数+返回值”,让模型能准确理解:

# 天气查询函数定义示例
def get_weather(city: str, date: str) -> str:
    """
    查询指定城市指定日期的天气情况
    :param city: 城市名称(如"北京"、"上海"),必填
    :param date: 日期(格式"YYYY-MM-DD"),必填,支持未来 7 天查询
    :return: 天气信息字符串(如"2025-10-01 北京 晴,18-26℃")
    """
    pass

4. 应用场景与实战案例

  • API 调用:查天气、订机票/酒店、股票查询、翻译接口;
  • 工具使用:调用计算器、绘图工具、文件处理工具;
  • 系统操作:操作数据库(查询/插入/更新数据)、发送邮件/短信、控制硬件设备。

实战案例:智能出行助手

  • 函数集合:get_weather(查天气)、search_train_tickets(查高铁票)、book_train_ticket(订高铁票)、get_hotel(查酒店);
  • 用户指令:“帮我订 2025 年 10 月 1 日从北京到上海的高铁票,再查一下上海当天的天气和附近的经济型酒店”;
  • 执行流程:模型依次调用 search_train_tickets→book_train_ticket→get_weather→get_hotel,最终返回整合后的出行方案。

5. 常见问题与避坑指南

  • 参数提取错误:指令模糊时(如“查明天的天气”未指定城市),模型需追问用户补充信息;
  • 函数选择错误:定义函数时需明确描述,避免模型混淆(如区分 get_weather 和 get_air_quality);
  • 执行失败处理:函数调用超时或失败时,模型需重试或提示用户“操作失败,请重试”。

四、Agent:让 AI 具备“自主决策能力”

Function Call 能调用单个工具,但现实中的复杂任务(如“规划一场 3 天的家庭自驾游”)需要多步骤、多工具、多轮决策——这就是 Agent(智能体)要解决的问题:让 AI 具备自主规划、迭代执行、闭环完成复杂任务的能力。

1. 核心定义与核心组件

Agent 是“具备自主决策能力的 AI 系统”,核心是“无需人类干预,独立完成复杂任务”。其核心组件包括 4 部分:

  • 感知模块:理解用户指令和外部环境信息(如任务目标、实时数据);
  • 规划模块:将复杂任务拆解为可执行的子任务,制定执行顺序(核心技术:思维链 Chain of Thought、任务拆解算法);
  • 执行模块:调用 Function Call 执行子任务,获取结果;
  • 记忆模块:存储任务历史、中间结果、用户偏好(短期记忆+长期记忆);
  • 反馈模块:根据执行结果调整后续步骤,处理异常情况(如子任务失败时重试或调整方案)。

2. 完整工作流程(以“规划济南→北京 3 天自驾游”为例)

  1. 任务接收:用户输入“帮我规划 2025 年 10 月 1-3 日从济南到北京的家庭自驾游方案,带老人和小孩”;
  2. 任务拆解:规划模块拆解为子任务:
    • 子任务 1:查询 10 月 1-3 日济南→北京沿途天气;
    • 子任务 2:查询济南→北京的高速路线(避开拥堵、适合老人小孩);
    • 子任务 3:查询沿途服务区、加油站分布;
    • 子任务 4:预订中途住宿(靠近高速、有家庭房、含早餐);
    • 子任务 5:推荐北京及沿途适合老人小孩的景点;
  3. 子任务执行:执行模块依次调用对应函数,获取结果(如天气晴朗、路线选择京沪高速、预订天津的酒店);
  4. 结果反馈与调整:反馈模块发现“10 月 2 日北京有小雨”,调整景点推荐(优先室内景点);
  5. 整合输出:将所有子任务结果整合为结构化的出行方案,包含每日行程、注意事项、应急方案。

3. 关键技术与典型模型

  • 核心技术:
    • 思维链(CoT):让模型逐步思考,提升任务拆解精度;
    • 强化学习(RLHF):通过反馈优化决策策略;
    • 工具调度算法:优化子任务执行顺序和工具选择;
  • 典型模型/框架:AutoGPT、LangChain Agent、Meta AI Agent、Qwen-Agent、Claude 3 Opus Agent。

4. 应用场景与实战案例

  • 复杂任务规划:旅行规划、市场调研、项目管理;
  • 智能办公:自动生成周报、整理会议纪要、安排日程;
  • 自主开发:代码生成→测试→部署的自动化开发流程;
  • 智能家居控制:根据用户习惯,自动控制灯光、空调、窗帘等设备。

实战案例:自动市场调研 Agent

  • 任务:“调研 2025 年中国新能源汽车市场规模、top3 品牌份额、消费者偏好,生成一份 5 页的调研报告”;
  • 子任务拆解:
    1. 检索 2025 年新能源汽车市场规模数据;
    2. 查询 top3 品牌的销量和市场份额;
    3. 收集消费者偏好调研数据(如续航、价格、智能化需求);
    4. 数据整理和可视化;
    5. 生成结构化调研报告;
  • 执行结果:Agent 自主调用 RAG 检索实时数据、调用 Excel 工具可视化、生成 Markdown 格式报告,全程无需人类干预。

5. 当前挑战与发展方向

  • 挑战:
    • 复杂任务拆解精度不足(如模糊指令的拆解);
    • 多工具协同冲突(如同时调用多个 API 时的参数协调);
    • 异常处理能力弱(如某个子任务失败后无法快速调整);
  • 发展方向:
    • 更强的记忆能力(长期记忆用户偏好和历史任务);
    • 跨领域任务适配(从办公到工业、医疗等专业领域);
    • 多 Agent 协作(多个 Agent 分工完成超复杂任务)。

五、MCP:AI 生态的“标准化接口协议”

随着 Agent 和工具的增多,出现了新的问题:不同工具的接入方式不同、模型与工具强绑定、跨平台复用困难——MCP(Model Context Protocol,模型上下文协议)正是为解决这些问题而生:它是 AI 世界的“USB 接口”,标准化模型与外部工具的连接方式。

1. 核心定义与设计目标

MCP 是由 Anthropic 于 2024 年 11 月开源的协议标准,核心目标是:

  • 标准化接入:定义统一的工具描述格式、调用流程、数据交互格式,让工具接入成本降低 90%;
  • 松耦合设计:模型与工具解耦,同一工具可被任意模型调用,同一模型可接入任意符合 MCP 标准的工具;
  • 跨平台兼容:支持不同 AI 平台、不同模型、不同工具之间的互联互通;
  • 生态共建:形成“工具市场”,开发者可上传符合 MCP 标准的工具,用户可像装插件一样使用。

2. MCP 解决的核心痛点(对比表)

无 MCP 时代 有 MCP 时代
每个工具需单独适配模型(M×N 对接) 工具按 MCP 标准开发,所有模型通用(M+N 对接)
模型与工具强绑定,更换模型需重新适配 松耦合,模型和工具可独立升级、替换
工具描述格式不统一,模型难以理解 统一的工具元数据格式,模型可自动解析
无统一工具生态,查找和使用困难 MCP 工具市场,一键安装使用
跨平台调用工具需二次开发 跨平台无缝调用,无需修改代码

3. MCP 协议的核心规范

MCP 协议的核心是“工具描述文件”和“调用流程规范”:

  • 工具描述文件:包含工具名称、功能描述、函数列表、参数规范、返回格式、错误码定义;
  • 调用流程规范:定义模型→工具的调用格式(如 JSON-RPC)、结果返回格式、异常处理机制;
  • 数据交互格式:标准化文本、图片、音频等多模态数据的传输格式。

工具描述文件示例(简化版)

{
  "name": "weather_tool",
  "description": "查询指定城市和日期的天气信息",
  "functions": [
    {
      "name": "get_weather",
      "description": "查询天气",
      "parameters": [
        {
          "name": "city",
          "type": "string",
          "required": true,
          "description": "城市名称,如北京、上海"
        },
        {
          "name": "date",
          "type": "string",
          "required": true,
          "format": "YYYY-MM-DD",
          "description": "查询日期,支持未来7天"
        }
      ],
      "return_type": "string",
      "error_codes": [
        {"code": 400, "message": "参数错误"},
        {"code": 500, "message": "服务异常"}
      ]
    }
  ]
}

4. 应用场景与生态进展

  • 开发者:按 MCP 标准开发工具,一次开发可适配所有支持 MCP 的模型;
  • 企业:快速接入各类工具,搭建 AI 应用(如企业智能助手接入考勤、财务、项目管理工具);
  • 用户:在 AI 平台上一键安装 MCP 工具,扩展 AI 能力(如在 ChatGPT 中安装 PDF 处理工具、翻译工具)。

生态进展

  • 支持的模型:Claude 3 全系列、GPT-4、Qwen-2、Llama 3;
  • 支持的工具:天气查询、地图服务、翻译接口、文件处理工具、企业 SaaS 软件(飞书、企业微信);
  • 工具市场:Anthropic 推出 MCP Hub,开发者可上传工具,用户可一键安装。

5. MCP 对 AI 生态的影响

  • 降低开发门槛:非专业开发者也能按标准开发工具,丰富 AI 生态;
  • 加速应用落地:企业无需重复适配工具,快速搭建定制化 AI 应用;
  • 推动标准化:避免行业碎片化,形成统一的 AI 工具接入标准。

六、核心逻辑:AI 技术栈的演进链与关系图

1. 演进逻辑(从基础到高级)

AIGC(基础生成能力)→ 解决“能生成内容” → 局限性:无实时性、不会用工具
↓
RAG + Function Call(能力补充)→ 解决“AIGC 不知道”(RAG)和“做不到”(Function Call)
↓
Agent(自主决策能力)→ 解决“复杂任务需要多步骤、多工具协同”
↓
MCP(标准化协议)→ 解决“工具接入混乱、生态碎片化”

2. 关系总结

  • 包含关系:RAG 和 Function Call 是 AIGC 的增强技术;Agent 集成了 AIGC、RAG、Function Call;MCP 是 Agent 和工具之间的标准化接口;
  • 核心目标:从“生成内容”到“解决问题”——AIGC 生成内容,Agent 解决复杂问题,MCP 让解决问题的过程更高效、更标准化;
  • 技术边界:
    • 简单内容生成(写文章、画画)→ 用 AIGC;
    • 实时/专业知识问答(查资料、企业文档)→ 用 AIGC+RAG;
    • 单一工具调用(查天气、订机票)→ 用 AIGC+Function Call;
    • 复杂任务(旅行规划、市场调研)→ 用 Agent;
    • 多工具接入、跨平台使用 → 用 MCP+Agent。

七、常见误区澄清

  1. “Agent 就是 Function Call”:错误。Function Call 是 Agent 的“执行模块”,Agent 还包含规划、记忆、反馈模块,能自主完成复杂任务;
  2. “RAG 和 Agent 互斥”:错误。RAG 是 Agent 的“检索模块”,Agent 可调用 RAG 获取实时信息,再结合其他工具执行任务;
  3. “MCP 只适用于 Anthropic 模型”:错误。MCP 是开源标准,支持多个模型和平台,是跨厂商的生态协议;
  4. “有了 Agent 就不需要人类了”:错误。当前 Agent 仍需人类干预复杂任务(如模糊指令澄清、异常情况处理),未来会逐步减少干预。

八、总结:AI 技术的未来趋势

AI 技术栈的演进,本质是“让 AI 从工具走向助手”的过程:AIGC 让 AI 能“说话”,RAG 和 Function Call 让 AI 能“知情”和“动手”,Agent 让 AI 能“思考”,MCP 让 AI 能“兼容更多工具”。

未来趋势清晰可见:

  1. Agent 成为主流:复杂任务将由 Agent 主导,人类只需下达目标,无需干预过程;
  2. MCP 生态爆发:标准化工具将越来越多,AI 应用开发将进入“插件化”时代;
  3. 多模态融合:AIGC、RAG、Function Call、Agent 都会支持多模态(如 Agent 能处理图文指令、调用多模态工具);
  4. 低代码/无代码开发:普通人也能通过拖拽工具、配置 Agent 流程,搭建自己的 AI 应用。

理解这些技术的关系和演进逻辑,不仅能帮你理清 AI 领域的混乱概念,更能让你精准把握技术趋势,在实际应用中选择合适的技术组合——比如开发企业知识库用 AIGC+RAG,开发智能助手用 Agent+Function Call,搭建跨平台应用用 MCP 协议。

如果你正在落地 AI 项目,不妨先明确核心需求:是生成内容、查询信息、执行简单任务,还是解决复杂问题?再选择对应的技术组合,让技术真正服务于需求,而非追逐热词。

除非注明,否则均为李锋镝的博客原创文章,转载必须以链接形式标明本文链接

本文链接:https://www.lifengdi.com/ren-gong-zhi-neng/4567

相关文章

  • 从技术本质到生态关联,一文吃透 AIGC、RAG、Agent、Function Call、MCP
  • AI Agent 扩展双雄:MCP 与 Agent Skill 深度拆解——从设计哲学到实战落地
  • 6款核心MCP协议工具让AI深度融入业务,告别“纸上谈兵”
  • 驾驭Claude的进阶之道:从对话工具到生产力中枢的10大高级技巧
  • 企业级自动化 Agent 架构深析:Prompt 演进驱动的智能工作流落地
本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可
标签: AIGC MCP RAG
最后更新:2025年11月10日

李锋镝

既然选择了远方,便只顾风雨兼程。

打赏 点赞
< 上一篇
下一篇 >

文章评论

1 2 3 4 5 6 7 8 9 11 12 13 14 15 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 46 47 48 49 50 51 52 53 54 55 57 58 60 61 62 63 64 65 66 67 69 72 74 76 77 78 79 80 81 82 85 86 87 90 92 93 94 95 96 97 98 99
取消回复

我是人间惆怅客,知君何事泪纵横,断肠声里忆平生。

那年今日(04月14日)

  • 2010年:中国青海玉树大地震
  • 1894年:托马斯·爱迪生展示了其新发明活动电影放映机
  • 1629年:荷兰物理学家克里斯蒂安·惠更斯出生
  • 1578年:西班牙国王腓力三世出生
  • 605年:隋炀帝下令开凿大运河
  • 更多历史事件
最新 热点 随机
最新 热点 随机
Everything Claude Code 详细使用文档 配置Jackson使用字段而不是getter/setter来序列化和反序列化 这个域名注册整整十年了,十年时间,真快啊 Claude Code全维度实战指南:从入门到精通,解锁AI编程新范式 Apollo配置中心中的protalDB的作用是什么 org.apache.ibatis.plugin.Interceptor类详细介绍及使用
AI时代,个人技术博客的出路在哪里?使用WireGuard在Ubuntu 24.04系统搭建VPN这个域名注册整整十年了,十年时间,真快啊WordPress实现用户评论等级排行榜插件WordPress网站换了个字体,差点儿把样式换崩了做了一个WordPress文章热力图插件
开发者必懂的 AI 向量入门:从数学基础到实战应用 分代ZGC这么牛?底层原理是什么? 图解 | 原来这就是网络 使用springboot结合AI生成视频 Java枚举梳理总结一 Excel2016右键新建工作表,打开时提示“因为文件格式或文件扩展名无效。请确定文件未损坏,并且文件扩展名与文件的格式匹配。”的解决办法
标签聚合
设计模式 ElasticSearch docker 多线程 SpringBoot JAVA AI 分布式 MySQL JVM Spring SQL 架构 K8s IDEA WordPress 数据库 AI编程 Redis 日常
友情链接
  • Blogs·CN
  • Honesty
  • Mr.Sun的博客
  • 临窗旋墨
  • 哥斯拉
  • 彬红茶日记
  • 志文工作室
  • 懋和道人
  • 拾趣博客导航
  • 搬砖日记
  • 旧时繁华
  • 林羽凡
  • 瓦匠个人小站
  • 皮皮社
  • 知向前端
  • 蜗牛工作室
  • 韩小韩博客
  • 风渡言

COPYRIGHT © 2026 lifengdi.com. ALL RIGHTS RESERVED.

域名年龄

Theme Kratos Made By Dylan

津ICP备2024022503号-3

京公网安备11011502039375号