大模型的思维链(Chain-of-Thought)

大模型的思维链(Chain-of-Thought)本质是使用“生成长度”换“计算深度”,也就是用更多token得代价换取模型多思考一会

33 5分钟

实测 GLM5.1 高速版,快到离谱还不掉智商

这是苍何的第 537 篇原创! 大家好,我是苍何。 说实话,用 AI Coding 这么久来,最让我崩溃的一件事就是:等。 你让它改个组件,转圈圈十几秒;让它重构个模块,一分钟过去了还在吐字。思路早就

185 5分钟

每月省一千,我雇了支 7×24 云端 Agent 团队

这是苍何的第 534 篇原创! 大家好,我是苍何。 前两天,我的视频生成团队"入职腾讯"了。 现在在 WorkBuddy 专家团里,已经有很多小伙伴开始拿它做短视频了。 我本来以为这件事差不多已经完成

92 6分钟

单个感知机为何无法解决异或问题?

本文从几何、数学证明、代码验证三个角度,彻底搞清楚这个深度学习史上最经典的问题,单层太浅,只能画直线;层越深,能画出的"曲线"就越复杂。

52 6分钟