面试现场
说说 ReAct 是怎么回事?
就是让模型边推理边行动,交替进行。
具体怎么交替法?
Think 一下,然后 Action,然后看结果,再 Think。
行,回去等通知吧——
到底怎么理解
ReAct =Reasoning(推理)+ Acting(行动),谷歌 2022 年提出来的。
核心思想就一句:让模型交替进行推理和行动,形成"思考 → 行动 → 观察"的循环,直到任务完成。
不是一次性规划好所有步骤再执行,而是走一步看一步,根据上一步的结果决定下一步。
三个关键标签
ReAct 用三个标签来组织整个过程:
Thought(思考)模型自己想:现在该做什么。这是"推理"部分。
Action(行动)具体要执行的动作——调用什么工具、传什么参数。这是"行动"部分。
Observation(观察)工具执行后返回的结果,喂给模型,用来做下一轮思考。
举个例子就懂了
用户问:“今天北京天气怎么样?”
| 步骤 | 内容 |
|---|---|
| Thought | 需要查询实时天气,调用天气 API |
| Action | call_weather_api(city="北京", date="today") |
| Observation | {"weather": "晴", "temperature": "28°C"} |
| Thought | 已经拿到天气数据,可以回答了 |
| Answer | 今天北京天气晴,气温 28°C |
看到没?整个过程是动态的——模型根据 Observation 的结果决定下一个 Thought,而不是提前规划好所有步骤。
ReAct 的优缺点
优势实现简单,Prompt 里给几个示例就能跑,不需要额外训练,适合动态环境。
缺点缺乏全局规划能力,容易陷入局部最优,不适合需要复杂长期规划的任务。
真实场景:到底用在哪?
网页浏览 AgentThought:需要搜索这个信息 → Action:调用搜索引擎 → Observation:拿到搜索结果 → 继续 Thought
游戏 NPCThought:玩家说了什么 → Action:生成回应或执行游戏动作 → Observation:玩家反应 → 调整策略
数据分析助手Thought:需要先查哪个表 → Action:执行 SQL → Observation:拿到数据 → 决定下一步分析
面试官爱问:ReAct 和 Chain-of-Thought 有什么区别? 答:CoT 只推理不行动,输出的是思维链,但没有外部工具调用。ReAct 把推理和行动结合起来,能通过工具获取外部信息。简单说:CoT 是"想一想",ReAct 是"想一想 + 做一做"。
实在记不住,就背这句
ReAct = 推理 + 行动交替执行,用 Thought / Action / Observation 三个标签组织循环,边想边做,动态完成任务。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~