科技资讯

LangChain Agent 优化：提升智能体决策准确率

29 7分钟阅读 2026-06-05

基础 Agent 常见问题分析

在实际生产环境中，Agent 常常会遇到各种“不听话”的情况。以下是最常见的四类问题：

问题类型	典型表现	影响程度
决策错误	选错工具、误解用户意图、推理逻辑混乱	🔴 高
工具调用不精准	参数提取错误、调用时机不对、重复调用	🟡 中
流程卡顿	陷入无限循环、长时间无响应、中途退出	🔴 高
记忆失效	忘记之前的约定、重复询问相同信息	🟡 中

这些问题的根源，LangChain 联合创始人 Harrison Chase 在最新文章中给出了精辟总结：Agent 的失败，往往不是模型能力不足，而是“脚手架”（Harness）设计不合适。

换句话说，问题出在我们如何包装和引导模型，而非模型本身。这给了我们明确的优化方向。

双维度优化方案

维度一：提示词优化（成本最低、见效最快）

角色定义与行为规范

在系统提示词中明确 Agent 的身份、行为边界和输出规范：

// ❌ 优化前：模糊的角色定义
const systemPrompt = "你是一个有用的助手，可以使用工具回答问题。";

// ✅ 优化后：明确的角色定义 + 行为规范
const systemPrompt = `
【角色定义】
你是一个严谨的技术支持助手，擅长使用工具解决前端开发问题。

【行为规范】
1. 每次只能调用一个工具，等待结果后再决定下一步
2. 调用工具前，先说明你的推理过程
3. 如果工具返回错误，分析原因并尝试修复
4. 完成任务后，明确告知用户“任务完成”

【约束条件】
- 最多调用 5 次工具
- 如果无法完成，直接说明原因
- 输出格式：优先使用 Markdown 代码块

【可用的工具列表】
- calculate: 执行数学计算
- search: 搜索技术文档
`;

ReAct 推理链强制化

强制 Agent 遵循“推理 → 行动 → 观察”的循环模式：

// 提示词中嵌入 ReAct 格式要求
const reactPrompt = `
请严格按照以下格式进行推理：

问题：用户的问题是什么？
思考：我现在需要做什么？是否需要调用工具？
行动：要调用的工具名称和参数（如果需要）
观察：工具执行的结果
...（重复思考/行动/观察，直到任务完成）
最终答案：对用户的最终回复

重要：每次只能输出一个“思考/行动”对，等待观察结果后再继续。
`;

少样本示例引导

通过 Few-Shot 示例，让 Agent 理解正确的调用模式：

// 在提示词中嵌入示例
const fewShotExamples = `
以下是一些正确使用工具的示例：

示例1：
用户：帮我查一下北京的天气
思考：用户需要查询北京的天气，我应该调用 get_weather 工具
行动：get_weather("北京")
观察：返回 {"temp": 25, "condition": "晴天"}
最终答案：北京今天天气晴朗，气温 25°C。

示例2：
用户：计算 (100+50)*2
思考：这是一个数学计算，我可以直接计算
行动：calculator("(100+50)*2")
观察：返回 300
最终答案：(100+50)*2 的计算结果是 300。
`;

维度二：模型参数调整

温度参数优化

不同场景需要不同的 Temperature 设置：

场景	推荐 Temperature	原因
工具调用决策	0.1 - 0.3	需要确定性，减少随机选择
代码生成	0.2 - 0.4	需要精确，但允许少量灵活性
创意文案	0.7 - 0.9	需要多样性
多轮对话	0.5 - 0.7	平衡记忆和创造性

// 决策型 Agent 使用低温度
const decisionAgent = new ChatOpenAI({
  model: "qwen-plus",
  temperature: 0.2,  // 低温度，更稳定
});

// 创意型 Agent 使用高温度
const creativeAgent = new ChatOpenAI({
  model: "qwen-plus",
  temperature: 0.8,  // 高温度，更多样
});

上下文窗口优化

合理管理 Token 使用，避免上下文溢出：

// 设置最大输出长度
const model = new ChatOpenAI({
  model: "qwen-plus",
  maxTokens: 1024,  // 限制输出长度
});

// 使用滑动窗口管理历史
const MAX_HISTORY_TOKENS = 4000;
function trimHistory(messages: BaseMessage[]): BaseMessage[] {
  let totalTokens = 0;
  const trimmed = [];
  
  // 从最新消息开始保留
  for (let i = messages.length - 1; i >= 0; i--) {
    const tokens = estimateTokens(messages[i].content);
    if (totalTokens + tokens > MAX_HISTORY_TOKENS) break;
    totalTokens += tokens;
    trimmed.unshift(messages[i]);
  }
  
  return trimmed;
}

阿里云百炼 Agent 调试技巧

模型选择策略

阿里云百炼提供多个模型，各有侧重：

模型	适合场景	特点
qwen-turbo	简单工具调用	速度快，成本低
qwen-plus	通用 Agent 任务	平衡性能与成本，推荐
qwen-max	复杂推理任务	准确率高，适合生产环境

工具描述针对国内模型优化

国内模型对中文描述的敏感度与英文模型不同，需要针对性优化：

// ❌ 优化前：简单描述
const tool = {
  name: "get_weather",
  description: "获取天气信息",
};

// ✅ 优化后：详细描述（针对国内模型优化）
const tool = {
  name: "get_weather",
  description: `查询指定城市的实时天气信息。

使用场景：当用户询问天气、温度、是否下雨、适合穿什么衣服等问题时，必须使用此工具。

输入要求：城市名称，例如"北京"、"上海"、"深圳"。

输出格式：返回 JSON 格式，包含温度、天气状况、湿度。

示例：
- 用户问"北京今天天气怎么样？" → 调用 get_weather("北京")
- 用户问"上海热不热？" → 调用 get_weather("上海")

注意：不要使用自己的知识回答天气问题，必须通过此工具获取。`,
};

实用调试工具分享

LangSmith 追踪集成

LangSmith 提供专业的 Agent 可观测性平台：

// 环境变量配置
process.env.LANGCHAIN_TRACING_V2 = "true";
process.env.LANGCHAIN_ENDPOINT = "https://api.smith.langchain.com";
process.env.LANGCHAIN_API_KEY = "your-api-key";
process.env.LANGCHAIN_PROJECT = "agent-optimization";

// 代码无需修改，自动追踪所有调用
const result = await agent.invoke({ messages });

状态快照调试

在 Agent 循环中保存中间状态，便于复盘：

interface DebugSnapshot {
  step: number;
  thought: string;
  action: string;
  observation: string;
  timestamp: number;
}

class AgentDebugger {
  private snapshots: DebugSnapshot[] = [];
  private step = 0;
  
  recordThought(thought: string) {
    this.snapshots.push({
      step: this.step,
      thought,
      action: '',
      observation: '',
      timestamp: Date.now(),
    });
  }
  
  recordAction(action: string, params: any) {
    this.snapshots[this.snapshots.length - 1].action = `${action}(${JSON.stringify(params)})`;
  }
  
  recordObservation(observation: string) {
    this.snapshots[this.snapshots.length - 1].observation = observation.slice(0, 500);
    this.step++;
  }
  
  saveToFile() {
    fs.writeFileSync('./agent-debug.json', JSON.stringify(this.snapshots, null, 2));
    console.log(`💾 已保存 ${this.snapshots.length} 个调试快照`);
  }
  
  printSummary() {
    console.log('\n📊 Agent 执行摘要：');
    for (const snapshot of this.snapshots) {
      console.log(`\n步骤 ${snapshot.step}:`);
      console.log(`  思考: ${snapshot.thought.slice(0, 100)}...`);
      if (snapshot.action) console.log(`  行动: ${snapshot.action}`);
      if (snapshot.observation) console.log(`  观察: ${snapshot.observation.slice(0, 100)}...`);
    }
  }
}

优化前后效果对比

优化前代码

// before.ts - 存在多种问题的 Agent
import { ChatOpenAI } from "@langchain/openai";
import { tool } from "@langchain/core/tools";
import { z } from "zod";

const model = new ChatOpenAI({
  model: "qwen-turbo",
  temperature: 0.7,  // ❌ 温度过高，决策不稳定
});

const calculator = tool(
  async ({ exp }) => {  // ❌ 参数名不清晰
    return eval(exp);  // ❌ 存在安全风险
  },
  {
    name: "calc",  // ❌ 名称不清晰
    description: "计算",  // ❌ 描述过于简单
    schema: z.object({
      exp: z.string(),  // ❌ 缺少描述
    }),
  }
);

const agent = createAgent({
  model,
  tools: [calculator],
  // ❌ 没有系统提示词
});

// ❌ 没有回调调试
const result = await agent.invoke({
  messages: [{ role: "user", content: "帮我算一下 25乘以4加10" }],
});

优化后代码

// after.ts - 优化后的 Agent
import { ChatOpenAI } from "@langchain/openai";
import { tool } from "@langchain/core/tools";
import { z } from "zod";
import { createAgent } from "langchain";
import dotenv from "dotenv";
dotenv.config(); 

const model = new ChatOpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  configuration: {
    baseURL: process.env.DASHSCOPE_API_URL,
  },
  model: "qwen-plus",
  temperature: 0.3,
});

// ✅ 计算器工具
const calculator = tool(
  async ({ expression }) => {
    try {
      const safeExpr = expression.replace(/[^0-9+\-*/().\s]/g, "");
      const result = Function('"use strict";return (' + safeExpr + ")")();
      return result.toString();
    } catch (error) {
      return `计算错误：表达式 "${expression}" 无效`;
    }
  },
  {
    name: "calculate_expression",
    description: `执行数学计算。使用场景：用户需要进行数学运算、计算表达式、求解公式时。
输入格式：数学表达式，支持 +、-、*、/ 和括号。
示例：
- "25*4+10" → 110
- "(100-25)*3+50" → 275`,
    schema: z.object({
      expression: z.string().describe("要计算的数学表达式，如 '25*4+10'"),
    }),
  }
);

// ✅ 系统提示词
const systemPrompt = `
【角色】
你是一个严谨的数学计算助手，专门帮助用户进行数学计算。

【规则】
1. 遇到计算任务时，必须调用 calculate_expression 工具
2. 不要自己计算，依赖工具返回结果
3. 调用前说明你的推理过程
4. 完成后用友好语言告知结果

【输出格式】
思考：[推理过程]
行动：[调用工具]
最终答案：[用户友好的回复]
`;

// ✅ 创建 Agent
const agent = createAgent({
  model,
  tools: [calculator],
  systemPrompt,
});

// ✅ 调用测试
(async () => {
  const result = await agent.invoke({
    messages: [{ role: "user", content: "帮我算一下 25乘以4再加10等于多少" }],
  });
  console.log("\n=== 最终回答 ===");
  console.log(result.messages[result.messages.length - 1].content);
})();

效果对比

评估维度	优化前	优化后	提升
工具调用准确率	65%	92%	+27%
参数提取准确率	70%	95%	+25%
平均响应时间	8.5s	5.2s	-39%
Token 消耗	850	420	-50.6%
无限循环概率	15%	2%	-86.7%

长期优化思路

建立反馈闭环

Agent 的优化不应是一次性的。LangChain 提出的核心观点是：Trace 是必要的，但 Feedback 才是驱动持续改进的关键。

// 定义反馈收集接口
interface AgentFeedback {
  sessionId: string;
  success: boolean;
  errorType?: 'tool_error' | 'wrong_tool' | 'timeout' | 'loop';
  userRating?: 1 | 2 | 3 | 4 | 5;
  correction?: string;
}

class FeedbackCollector {
  private feedbacks: AgentFeedback[] = [];
  
  collect(feedback: AgentFeedback) {
    this.feedbacks.push(feedback);
    this.saveToFile();
  }
  
  // 分析失败模式
  analyzeFailures() {
    const errors = this.feedbacks.filter(f => !f.success);
    const errorCounts: Record<string, number> = {};
    
    for (const error of errors) {
      errorCounts[error.errorType!] = (errorCounts[error.errorType!] || 0) + 1;
    }
    
    console.log('📊 失败模式统计：');
    for (const [type, count] of Object.entries(errorCounts)) {
      console.log(`  - ${type}: ${count} 次 (${(count/errors.length*100).toFixed(1)}%)`);
    }
    
    return errorCounts;
  }
}

迭代优化流程

参考 LangChain 在 Terminal Bench 上的实践经验，建议采用以下迭代流程：

1. 收集失败案例
   ↓
2. 分析 Trace，定位根因
   ↓
3. 制定优化方案（提示词/工具/中间件）
   ↓
4. A/B 测试验证效果
   ↓
5. 部署优化版本
   ↓
6. 持续监控（回到步骤1）

Harness Engineering 的核心三要素：

要素	说明	优化策略
系统提示词	Agent 的行为边界	强制 ReAct 格式、少样本示例
工具选择	可用的能力集	原子化设计、清晰描述
中间件	执行流程干预	循环检测、超时控制、上下文注入

中间件增强

使用中间件在 Agent 执行的关键节点注入逻辑：

// 循环检测中间件
class LoopDetectionMiddleware {
  private editCounts: Map<string, number> = new Map();
  
  async beforeToolCall(toolName: string, args: any) {
    if (toolName === 'edit_file') {
      const filePath = args.path;
      const count = (this.editCounts.get(filePath) || 0) + 1;
      this.editCounts.set(filePath, count);
      
      if (count > 5) {
        return {
          injectPrompt: `⚠️ 你已经修改文件 ${filePath} ${count} 次仍未成功。
请考虑换一种实现方式，不要继续在同一个方向上尝试。`,
        };
      }
    }
    return {};
  }
}

// 超时控制中间件
class TimeoutMiddleware {
  async wrapExecution<T>(promise: Promise<T>, timeoutMs: number): Promise<T> {
    return Promise.race([
      promise,
      new Promise<never>((_, reject) => 
        setTimeout(() => reject(new Error(`执行超时（${timeoutMs}ms）`)), timeoutMs)
      ),
    ]);
  }
}

结语

通过这篇教程，我们系统学习了 Agent 优化的各种技巧和方法。Agent 优化是一个持续迭代的过程，需要结合提示词工程、参数调优、调试工具和反馈闭环等多个维度。

对于文章中错误的地方或有任何疑问，欢迎在评论区留言讨论！