科技资讯 - 最新AI与科技前沿动态

大模型入门：从 MHA 到 GQA，一次讲清 KV Cache 为什么能省显存一、推理显存经常卡在 KV Cache 很多人第一次跑本地大模型，会以为显存主要被模型参数吃掉。这当然没错。一个 7B

25 12分钟

1. 前言上篇文章我们实现了一个最小可运行的 AI Agent，但存在一个问题：每次重启后，Agent 就像失忆了一样，不记得你是谁、你的偏好是什么。

40 2分钟

一.Node基础笔记 1.给节点添加retry_policy和cache_policy 二.Edge基础笔记 1.普通边执行结果： 2.条件边执行结果： 3.多个条件边执行结果：

15 6分钟

本文介绍了两种让LLM输出结构化JSON的方案：1）Prompt约束+后处理，兼容性强但需额外容错逻辑；2）使用AI SDK的generateObject函数，结合Zod Schema定义输出格式，自

37 9分钟

本文基于 2026年 LangChain 官方最新稳定版（v1.x）重写，旨在向入门学习者，快速入门LangChain！

57 10分钟

火山引擎ArkClaw迎来重大升级，主打体验与功能优化。新版本重构界面交互，输入框升级为智能创作中枢，导航栏精简入口、支持文件云端流转。同时强化Agent协作能力，新增后台安装、定时任务等功能。

106 6分钟

Apple Silicon 经过多年的架构演进，在本地运行大语言模型的体验已经达到生产环境的标准。随着 2026 年 Ollama 0.19 版本的发布以及底层推理引擎全面切换至 MLX，Mac 设备

131 7分钟

深入拆解 Agentic RAG 与 Pipeline RAG 的本质区别：Agent 如何自主决定是否检索、查哪个知识库、以及检索质量不足时如何自我修正。

106 12分钟

stop-slop 是一个 Claude Code Skill 文件，专门识别并消除 AI 生成文本中的可预测模式——从「清嗓式」开头、二元对立结构、被动语态，到副词滥用和空洞的宏大宣言。

88 9分钟

一、基于丢弃与保留的策略（最直接、最常用）这类方法的核心是判断哪些记忆值得保留，哪些可以直接扔掉。滑动窗口原理：只保留最近N轮对话或最近K个时间步的记忆，更早的直接丢弃。特点：实现极简单，适合

75 8分钟

Vibe Coding 全栈实战：章鱼哥解题 06｜对话持久化与用户数据隔离上一期把前后端鉴权链路打通以后，后端终于不再只是被动接收请求，而是能知道“这个请求来自哪个用户”。但这还只是身份链路的起

49 14分钟

大家好，我是孟健。这几天我用 13 个 Agent 跑完了一个真实 AI 工具站，最后发现：出问题最多的地方，不是写代码，是交接。现在 Codex、Claude Code、Cursor、Copil

216 8分钟