科技资讯 - 最新AI与科技前沿动态

Agent 聊完就失忆，本质是 LLM 无状态。本篇加上分层记忆、 RAG 检索。最终实现 Agent 能记住会话上下文，也能跨会话检索历史。

95 10分钟

今天使用Claude code结合Superpowers插件做一些实战。为什么要使用Superpowers呢？

168 3分钟

先搞懂核心：Skills vs MCP 到底有啥区别？很多刚接触 Claude Code 的新手，第一步就容易栽在「Skills」和「MCP 服务器」的认知混淆上，对比项 Skills MCP 服

415 10分钟

最近给一个小团队的内部 AI 服务做上线前检查。Demo 阶段很顺：单台 GPU、一个 vLLM 容器、外面接 OpenAI-compatible API。真正准备给全组试用时，问题变成了：GPU 要

43 3分钟

Agent 怎么记住你？怎么越用越聪明？本文拆解 Hermes 的记忆系统和技能系统，看 Agent 如何持续学习。

55 7分钟

一个 Agent 不够？那就生一堆。本文拆解 Hermes 的子代理系统，看它如何并行调用多个子 Agent 协同工作。

38 6分钟

AIOps缺的不是一个单纯的聊天入口，而是一个运行在浏览器扩展里的执行助手：能理解当前页面，能根据自然语言任务操作控制台，能在不确定或高风险时把控制权交还给人，也能把一次成功的操作沉淀

78 16分钟

WebGPU 与 Transformers.js 让浏览器原生运行量化大模型，无需 Python 和 API，数据零出端、零成本、低延迟，前端工程师可随手构建端侧 AI 应用。

107 11分钟

深入拆解 Agent 意图识别层的必要性：关键词方案为何在生产中失效、LLM 分类器如何处理自然语言歧义、LangGraph 如何把不同意图路由到专项 Agent

185 16分钟

Lance 是 ByteDance Intelligent Creation Lab 推出的原生统一多模态模型，以 3B 激活参数和多任务协同训练，在单一原生统一框架中支持图像/视频理解、生成与编辑

104 10分钟

DeepSeek-Reasonix 是个专门给 DeepSeek 做的终端编程助手，靠着"缓存优先"的设计，能把缓存命中率做到 85%-99%，API 成本直接砍 80%-93%。

136 7分钟

Knowledge Work Plugins 是 Anthropic 官方开源的 11 个职能插件，覆盖销售、法务、财务、数据、生物研究等核心知识工作岗位。

133 9分钟