第 5 篇:Agent 记不住事?补上 Memory + RAG 检索
Agent 聊完就失忆,本质是 LLM 无状态。本篇加上分层记忆、 RAG 检索。最终实现 Agent 能记住会话上下文,也能跨会话检索历史。
聚焦AI人工智能 · 前沿技术动态 · 深度行业解读
Agent 聊完就失忆,本质是 LLM 无状态。本篇加上分层记忆、 RAG 检索。最终实现 Agent 能记住会话上下文,也能跨会话检索历史。
今天使用Claude code结合Superpowers插件做一些实战。为什么要使用Superpowers呢?
先搞懂核心:Skills vs MCP 到底有啥区别? 很多刚接触 Claude Code 的新手,第一步就容易栽在「Skills」和「MCP 服务器」的认知混淆上, 对比项 Skills MCP 服
最近给一个小团队的内部 AI 服务做上线前检查。Demo 阶段很顺:单台 GPU、一个 vLLM 容器、外面接 OpenAI-compatible API。真正准备给全组试用时,问题变成了:GPU 要
Agent 怎么记住你?怎么越用越聪明?本文拆解 Hermes 的记忆系统和技能系统,看 Agent 如何持续学习。
一个 Agent 不够?那就生一堆。本文拆解 Hermes 的子代理系统,看它如何并行调用多个子 Agent 协同工作。
AIOps缺的不是一个单纯的聊天入口,而是一个运行在浏览器扩展里的执行助手:能理解当前页面,能根据自然语言任务操作控制台,能在不确定或高风险时把控制权交还给人,也能把一次成功的操作沉淀
WebGPU 与 Transformers.js 让浏览器原生运行量化大模型,无需 Python 和 API,数据零出端、零成本、低延迟,前端工程师可随手构建端侧 AI 应用。
深入拆解 Agent 意图识别层的必要性:关键词方案为何在生产中失效、LLM 分类器如何处理自然语言歧义、LangGraph 如何把不同意图路由到专项 Agent
Lance 是 ByteDance Intelligent Creation Lab 推出的原生统一多模态模型,以 3B 激活参数和多任务协同训练,在单一原生统一框架中支持图像/视频理解、生成与编辑
DeepSeek-Reasonix 是个专门给 DeepSeek 做的终端编程助手,靠着"缓存优先"的设计,能把缓存命中率做到 85%-99%,API 成本直接砍 80%-93%。
Knowledge Work Plugins 是 Anthropic 官方开源的 11 个职能插件,覆盖销售、法务、财务、数据、生物研究等核心知识工作岗位。