2026 年 04 月阅读洞察分享
我们做了一个决定,我们尝试一个月不发表关于任何看过的文章、视频内容的阅读/观看感想,但我们仍然会把我们把那些看起来感兴趣想去阅读和观看的内容收藏起来,6 月份的时候翻出来一篇一篇的回看,看有多少已经是过时的信息,也就是大家说的,只要我学的慢,1 个月后就发现不用学了,因为这些知识可能已经被更新了,而且他们还不是经典知识,不具备持久性。
mythos 模型的推出,6 月出来了,媒体炒个热度,也就那样,虽然模型很夸张,但其实过去一个月我们根本不需要去跟进和焦虑。
fetch-skill。现在 codex 等都有 computer use 和浏览器插件,kimi 也出 kimi webbridge,都可以直接操作电脑或浏览器。
MMX-CLI。很多产品都做了 CLI,比较出名的飞书、钉钉、codex 等,我们也自己参考有模有样给出一个不错的 CLI+SKILLS 的套件,现在工具都会携带对应的 SKILL,直接安装 CLI、bridge 插件等再配上对应 SKILL,来通过专有经验高效合理地使用这些工具。
GitHub 上一路飙到 3.2 万 Star 的 Claude Code 最佳实践,开源了。
除了 Superpowers 在周边范围听见比较多的人在使用外,其他插件我们并没有有太多时间和场景的实践。
- Everything Claude Code(13.7 万 Star),走的是大而全路线,38 个命令、75 个 Agent、156 个 Skill,特色是 instinct scoring 和 AgentShield 防护机制,适合想要一套开箱即用完整方案的团队
- Superpowers(13.5 万 Star),核心理念是 TDD 优先,有一套 Iron Laws 强制约束代码质量,还有 whole-plan review 机制,适合对代码质量要求高的项目
- Spec Kit(8.5 万 Star),走 spec 文档驱动的路子,先写规格说明再让 AI 执行,集成了 22+ 工具,适合流程规范的团队
- gstack(6.4 万 Star),特色是角色扮演模式,给不同 Agent 分配不同人设,支持并行冲刺,适合多任务并行的场景
技术教科书:顶级开发团队设计的 Harness 工程项目源码什么样
洞察:顶级开发团队 A 社...工具扩展与管理能力、循环状态管理、自动做梦系统、宠物系统的设计是我们比较感兴趣的实践,初看难度不大,但为这个阶段的工程师们指明了一个可行的实践方向,这个时候有人给出可行的实践方向和不可行的路径都是很宝贵的经验。
我们信奉一个什么呢:物极必反。
科学的方法就是一个循环:观察、假设、实验、研究/评估,让 Agent 像乌鸦一样思考。循环即实验室:八个 AI 自主研究系统横评
洞察:感知(Perceive)、记忆(Remember)、推理(Reason)、行动(Act)、评估(Evaluate)、变异(Mutate)、协调(Coordinate)、治理(Governance)。
下一个前沿不是更强的独立 Agent,而是它们的组合架构。
领导的价值有一点在于处理熵增,为团队注入能量,保持秩序避免混乱。而领导自身是需要反脆弱的,不仅仅是坚韧。
反脆弱:在不确定的高压环境下成长,那些没有杀死我的将让我更强大。不回避失败,主动解剖失败。
目标是野心勃勃,目标不是用来完成的,而是用来突破的,目标的完成率最好的情况是 60~70%,在我们这里是 80%,如果目标完成率是 100%,说明目标太低了,不健康。
目标与负责人应该是挂钩的,应该是组织内公开的,让负责人自主驱动自己的目标。
按志向分配,以前是按智分配,以前的智慧比如在改革开放前认识字意味着有智慧,计算器出现之前,心算能力意味着有智慧,计算机出现之前能编排组织制度的人意味着有智慧,罗振宇说的很有道理,工具的变革,让智慧发生了定义上的变化,AI 时代什么的行为才叫有智慧呢?有目标有志向有愿景的人,且能快速实现目标/志向/愿景的人是有智慧的人。
我们需要有智慧的人,我们需要能利用新工具来实现目标的人,我们需要这些负责人,我们需要这些人来填充位置。
管理,在过往本质上来说是管理人的不可靠性。未来 AI 当做人看的时候,管理就是为了管理 AI 的不可靠性。如何管理 AI 的不可靠性呢?为 AI 准备环境,为 AI 提供经验,把 AI 当人来看,教 AI 学会模仿聪明人的行为,让 AI 能够像人一样思考,像人一样行动,像人一样评估。