残差连接:为什么深层网络必须留一条直路

从 ResNet 的核心思想出发,讲清 Transformer 里残差连接真正解决的不是“信息保留”这种空泛说法,而是优化路径、梯度传播和迭代修正。顺带说明为什么 pre-norm 能训得更深、为什么

77 5分钟

超越Harness Engineering: AGE 应用开发模板介绍

在我此前的两篇文章中已经介绍了AGE的基本理论概念以及它和Spec-Driven开发以及Harness Engineering的区别。 为了便于实际落地AGE的实践,我新建了一个新的模板项目attra

54 8分钟
手把手教你写一个 AI Skill,让 AI 真正学会你的工作流

手把手教你写一个 AI Skill,让 AI 真正学会你的工作流

Skill 可以理解成 AI 的“专业能力模块”。 它不是临时 prompt,也不一定要联网调用外部工具。 更准确地说,它是一个文件夹,把某类任务里的经验、规则、操作流程和注意事项都收进去,后面反复用

3,557 15分钟