目录
Contents
把文章交给 AI 解读 Hand Off the Essay to AI
-
STEP 1
复制提示词 Copy the prompt
-
STEP 2
前往 Agent Open an agent
-
STEP 1
下载文档 Download the markdown
下载 Markdown Download Markdown -
STEP 2
复制提示词 Copy the prompt
-
STEP 3
前往聊天模型 Open a chat model
第一章 · 协作的诞生
周一早上九点。
打开电脑,等屏幕亮起来。还没坐稳,跳出一条新消息,主题是「【P0】关于 X 项目的紧急讨论」,说今天上午十一点要拉一个会,会议邀请已经发出,请准时参加。
差不多同一时间,老张在飞书上 @ 你。说领导刚才在群里讲了一个新需求,定级 P0+,比之前那个还急,下午两点也要开个会勾兑一下。他把那条领导的消息转发过来。看了一眼,描述大概一百字,意思能看懂,但具体要做什么、做到什么程度、谁验收、什么时候上线,全部没有。
老张说,他也不太清楚,要开会才能定。
P0 那边的需求文档已经被发到群里。点开看,三页 PRD,写得很整齐,结构清晰,每一段都看起来很专业。读完之后发现,关键的几件事都没写:用户路径里有一个分支没有交代,数据接口的字段没有定义,上线时间用了「尽快」两个字。
需要找产品经理把这几件事问清楚。打开她的日历,今天上午她有两个会,中午一个外部午餐,下午一个会。日历上写着「下午 4 点之后可约」。
发消息过去:你下午四点之后有时间吗,我想问几个关于这个 PRD 的问题。
她回:好的,但我四点那个会可能会拖到五点,五点之后随时。
看了一下时间,已经十点一刻了。
距离下一个真正可以做事的时刻,还有七小时四十五分钟。
这是一次协作的开始。两个 P0 项目、两个会、一份不完整的 PRD、一个要等到八小时之后才能接通的人。
把这一天的动作摊开看,真正在「做事」的时间是少数。大部分时间在做另外的事:等人、对齐、解释、复述、追问、确认。这些动作本身不产出任何东西。它们存在的全部理由是,这件事大到一个人做不完,必须有别人参与。
一旦有别人参与,协作开始。一旦协作开始,所有这些动作就开始消耗时间。
这件事不是当代写字楼独有的。它从一万年前就开始。
一万年的同一件事
五个人。一头猛犸象。
公元前一万年的某个清晨,他们在草原上看见这头象。一个人面对一头猛犸象会跑掉。五个人加在一起,机会出现。但机会要兑现,他们必须做一件事:在象注意到他们之前,决定好谁从左边接近,谁从右边接近,谁来发出第一击,其他人在哪里等待。
这件事必须在不出声的情况下完成。
这是协作的第一个具体形态。它要解决的问题在那一刻就已经全部出现。谁手里有什么信息:谁看到了象的右后腿在抖。每个人接下来要做什么:左边、右边、正面。谁先动谁后动:时机错了所有人会死。出了事谁负责:哪一个人没扛住自己的位置。
那个早上之后的一万年里,协作的具体形态反复变化。城邦、商队、行会、工厂、公司、跨国集团。规模从五个人变成两百万人。要解决的问题不变。
协作要解决的三件事
把一万年里所有协作形态拆到最小单位,要解决的事其实只有三件。
信息流动。一件事被几个人分头做,每个人手里只有一部分信息。要让事情整体推进,信息必须在人之间流动。谁知道什么、谁需要知道什么、什么时候让对的人知道对的事。
判断形成。信息流动起来之后,要基于这些信息做出判断。要不要做、做什么、怎么做、谁来做。判断可以由一个人做,也可以由几个人共同做。
决定执行。判断做出来之后,要变成具体的动作。谁在什么时候做什么、做完之后交给谁、出了问题谁来兜。执行需要协作主体之间的配合、跟进、检查。
任何一个协作场景,无论是猛犸象还是上市公司,本质上都是这三件事在不同的规模、不同的复杂度、不同的工具下的展开。
但如果协作的主体是一个完美的认知主体,他注意力无限、记忆完美、判断稳定、能直接感知其他主体的状态、不会自欺、不会被情绪干扰、不会忘记承诺,那么这三件事都不需要任何特殊机制。
这里说的「完美认知主体」并非完美的公司、部门或利益集团,而是指目标一致、事实透明、记忆完美、判断稳定的两个人。他们仍然需要协作,因为有些事一个人做不完。只是协作对他们来说只剩下任务本身,不需要再发明一整套会议、汇报、PRD、周报、对齐会和责任锚定机制。
信息流动?两个完美主体之间不需要会议,不需要邮件,不需要文档。他们能直接知道彼此手里有什么。
判断形成?两个完美主体之间不需要对齐会,不需要 PRD,不需要复盘。他们的判断会自然收敛到同一个对的方向。
决定执行?两个完美主体之间不需要项目计划,不需要状态汇报,不需要责任分工。他们会各自接住自己应该做的部分。
协作的核心动作是简单的。复杂的是协作的主体:有缺陷的,不完美的人。
协作机制都在解决人的缺陷
人和完美认知主体之间的差距,可以列出一个清单。
这里说的「缺陷」不是道德缺陷,也不是智力缺陷。它指的是人作为生物性协作主体的天然限制:注意力有限、记忆不稳定、状态不可见、表达有损耗、情绪会干扰判断。任何认知能力再强的人都不能完全摆脱这些限制。差别只是程度。
注意力是局部的。一个人没办法同时关注所有事,也记不住别人告诉过他什么。所以需要把分散的信息物理性地汇拢,让它们撞到每个人的注意力上。
记忆会重写。每个人对过去发生的事都会按对自己有利的方向回忆,不同人的版本会越来越偏离。所以需要现场的共同见证,需要会议纪要,需要可以被反复调取的记录。
判断会固化。一个人独立判断久了,会陷在自己的视角里。所以需要外部的碰撞才能跳出来。
会自欺。脑子里觉得自己想清楚了,其实没有。说出来才发现「我以为我想清楚了,但说不出来」。所以需要被强制言语化的场合。
会假设性对齐。两个人聊完都觉得对齐了,回去做发现做的不是一回事。所以需要把所指对到一个具体物理对象上,一份文档、一张图、一个原型。
会逃避责任。事后说「这不是我定的」「我不知道」「我反对过」。所以需要在现场公开见证,把承诺固化在公共场域里。
会被情绪干扰。情绪不被处理就会以扭曲形式渗入判断和执行。所以需要给情绪一个出口。
会被社会压力压住。有判断但不说,因为不是最资深的、声音不够大、不愿意得罪人。所以需要一种被允许说话的形式。
会把分歧人格化。一个人单独反对另一个人的判断,被读成「我反对你」。所以需要一种形式化的场合,把人和判断分开。
不会自动认同集体。每个人天然把自己当个体,不会自动意识到「我属于这个组织」。所以需要反复演练这件事,让组织在每个人脑子里成为真实的存在。
这个清单可以列得更长。但已经够了。
工业时代发展出来的全部协作机制,周会、月会、季度 review、OKR、KPI、汇报线、矩阵管理、立项、评审、复盘、kickoff、status update、stakeholder meeting,每一项都不是为协作本身设计的,是为了纠正协作主体的某种缺陷而设计的。
协作机制是为有缺陷的人发明的脚手架。
一个推论
如果上面这个判断成立,有一个直接推论。
协作机制的密度和复杂度,和协作主体的缺陷量成正比。
完美认知主体组成的团队,需要零协作机制。认知能力高、互相信任、判断稳定的小团队,需要极少机制。认知能力参差、互信低、判断不稳定、有派系、有政治的大组织,需要大量复杂的机制。
工业时代发展出那么复杂的协作体系,不是因为协作本身有那么复杂,是因为它处理的是大量认知能力一般的人组成的大组织。机制的复杂度是用来兜住这些人的缺陷的。
回到第一章开头的那个早上。两个 P0、两个会、一份不完整的 PRD、一个八小时之后才能接通的产品经理,所有这些复杂度都来自于人的缺陷,而非这件事本身的复杂程度。需要这一整套机制,是为了兜住做事的人的缺陷。
这不是某个人的过错,也不是某个公司的管理问题。它是工业时代协作机制的内在逻辑。
当协作主体的缺陷开始被外化
但这个逻辑有一个前提。
它假设人的缺陷是一个固定常数。所以协作机制的复杂度是固定的、必要的、不可压缩的。
这个前提在当下开始松动。
记忆缺陷可以被外化到持续维护的共同记忆里。信息局部性可以被外化到 AI 可调取的信息层。判断固化可以被外化到 AI 作为反方。自欺可以被外化到对 AI 的言语化。假设性对齐可以被外化到结构化的共同所指。一些缺陷甚至可以被根本性地绕过:表达性劳动可以被外化到翻译层,让判断和判断的传播被解耦。
如果缺陷可以被外化,协作机制的存在前提就开始失效。
这不意味着协作消失。协作的三件事还在:信息流动、判断形成、决定执行。但它们承载的形式可能完全不同。协作本身不会消失,消失的是那一整套庞大的、复杂的、专门设计来兜住缺陷的脚手架。
高认知高杠杆小团队的处境
把上面的判断推到一个具体的场景。
一个 3 到 5 人的小团队。每个人都是高认知能力的判断者。每个人都用 AI 把自己的产出能力放大几十倍。他们之间高互信、判断风格相近、方向大致对齐。
这种团队里,协作机制应该是什么样?
旧的那一整套,周会、汇报、复盘、对齐会、kickoff、PRD、deck、status update,里面有多少是必要的?有多少是浪费时间的?有多少不仅没用,反而在反向消耗这个团队真正稀缺的东西,判断带宽?
如果一个高认知判断者的产出是脉冲式的,可能几天推进完过去一个团队几周的工作、可能一周陷在一个难题里毫无可见产出,那么以「线性进度」为内在假设的所有协作机制是不是都失效?
如果团队成员之间的记忆、信息、判断都被系统层吸收了,那么以「人脑是协作主体」为内在假设的所有沟通工具是不是都不再适用?
如果协作机制都在解决人的缺陷,而这种团队的人的缺陷已经被大幅外化,剩下还需要什么?
回到那个周一早上九点。
打开电脑、收到 P0、被拉进会、看不懂 PRD、等不到产品经理。这是一次协作的开始,也是一次工业时代协作机制完整运转的开始。这套机制从一万年前的草原延续到 2026 年的写字楼,规模变化了百万倍,本质没变。
它要纠正的,从来是人。
后面五章,看人作为协作主体的缺陷被大规模外化之后,会发生什么。
第二章 · 显式仪式
下午两点。
会议室里坐了十二个人。投影上是 P0+ 那个需求的 PPT,写得很整齐,三十八页。
老张主持。他先讲背景,讲了八分钟。这八分钟里说的内容,群里那条领导的消息和今天上午的邮件都已经讲过,但他还是讲了一遍,因为在场的人里有一半是上午没在群里、不知道前因后果的。
讲完背景,开始过 PPT。从第一页过到第二十页用了二十五分钟。其中第四页有人提了一个问题,关于上线时间能不能再推一周,老张说这个要看技术评估,先记下来。第九页有人问数据接口怎么对接,老张说这个产品还在确认,先记下来。第十四页有人提了一个完全不在议题里的事,问的是上个季度某个项目的进展,被主持人礼貌地引导回来,但花了三分钟。
到了第二十一页,已经有人开始在自己电脑上回消息了。
最后十五分钟讨论 action items。每件事都被分配到具体的人,每个人都说「好的,我跟进」。会议纪要由会议秘书整理,会后发到群里。
散会的时候三点四十分。
回到工位上,发现刚才会上提到的几个问题,没有一个有真正的答案。
这大约是一次按工业组织里所有公司的标准来说,合格的会议:准时开始、有议程、有议事记录、有 action items、所有相关人到场。如果会后做一次 retro,参与者大概率会评价「这次会议讨论得比较充分」「该说的都说了」「下一步明确了」。
但这一个半小时里真正改变了什么?
下午三点四十分会议室里那十二个人散开之后,他们手里的活、面临的判断、要做的决定,和下午两点会议开始之前比,没有任何变化。讨论过的几个问题没有得到答案。要被分配的 action items 大部分是「确认」「跟进」「再讨论」,这些动词的共同特征是,它们的功能不在做真正的工作,而在把工作推到下一个会。
唯一被消耗掉的,是这十二个人的一个半小时。
仪式不是为了产出存在
会议、汇报、复盘、评审、对齐会、kickoff,这些东西放在一起,可以叫显式仪式:专门设立的、需要参与者投入注意力的、有明确开始和结束的协作动作。
它们的共同特征是:投入大量的人时,但产出经常说不清楚。
工业组织里这类仪式占的时间不少。Microsoft 2023 年覆盖三万一千人的工作趋势调查发现,平均员工 57% 的工作时间花在「沟通」上(会议、邮件、聊天),43% 花在「创造」上(文档、表格、演示)。Asana 把这个画面切得更细:60% 协调、27% 基于技能的工作、13% 战略规划。换一种说法,一个白领的工作日里,真正用来做判断和生产的时间,大约只剩下 40%。
会议本身在这 60% 里占了相当一块。一个 2022 年的研究发现,普通员工每周参加 11 到 25 个会议,平均每周开会 4.48 小时。高管和经理的数字更高:每周 23 小时开会,其中近一半被参与者自己判断为无效(Harvard Business Review)。Korn Ferry 的调研里 67% 的中层认为开会过多让他们没法完成工作。每年人均花在被自己判定为不必要的会议上的时间是 103 小时,大约 13 个工作日。
这些数字本身不让人惊讶。在写字楼里待过的人都对这个画面有体感。但有一个问题这些数据本身回答不了。
如果开会是这么明显的浪费,为什么所有人还在开?
不是因为有什么文化问题。是因为仪式真的在解决某种问题,只是这个问题大多数时候没有被精确说出来。
仪式实际在做的事
把 P0+ 那个下午的会拆开看,它表面上的功能是「讨论需求」,但底下做的事不止一件。
信息汇拢。会议室里十二个人,每个人手里有不同的局部信息。产品手里有客户那边的最新口径,工程手里有现有系统的约束,设计手里有最近用户调研的发现,运营手里有上线节奏的现实考量。这些信息单独看都是局部,拼起来才有完整的图景。把所有人拉到一个会议室里,是把这些局部信息物理性地汇拢的一种方式。
视角碰撞。十二个人里产品、工程、设计、运营、市场各有视角。同一份 PRD 拿在不同人手里读出的东西完全不同。产品看的是用户路径,工程看的是技术可行性,设计看的是交互逻辑,运营看的是上线之后的复杂度。这些视角不在一个场子里被强制相遇,就只能各自做各自的判断,最后拼不到一起。
判断校准。十二个人对这件事的优先级、做法、风险点的判断都不一样。会议是让这些判断收敛的场合。这种收敛不要求所有人达成完全一致,只要求大家至少知道彼此的判断在哪里、分歧在哪里。
责任锚定。会议上分配的 action items,被在场的所有人共同见证。事后如果说「这不是我答应的」「我不知道有这件事」,这些话会站不住脚。会议把承诺固化在公共场域里。
共同记忆。会议结束后,「上次会上我们说过」这句话有意义,因为这是被在场的人共同确认过的。没有这种共同记忆,每个人对过去的回忆都是自己版本的,争执起来没有公共参照。
让沉默的人被听到。会议室里有一些人不会主动说话,但他们的判断可能是关键的。主持人会显式地点名让这些人发言,「小王你怎么看」「设计这边有什么想法」。没有会议这种形式,这些人的判断永远不会进入决策过程。
给情绪一个出口。每个人对这件事可能有不同的情绪,觉得方向不对的、觉得节奏太紧的、觉得自己被忽视的、觉得跨部门配合不畅的。会议是一个相对正式的场合让这些情绪被说出来,不说出来会以其他形式渗入后面的协作。
演练权力结构。谁主持会、谁先发言、谁可以打断别人、谁最后拍板,这是组织权力关系的一次具体展演。每开一次会,这套结构在所有人脑子里被强化一次。这件事的功能不在协作层面,而在让组织的权力分布持续保持清晰。
如果列得更全,还有筛选评估人、传递文化、制造节奏、降低对抗的人格化、让模糊的想法被强制言语化。一次会议同时在做的事可能有十几件。
这是为什么一个看起来「没有产出」的会议,参与者事后又说不清它没用在哪里。它真的在做事,只是做的事不是表面那件。
这些事都在做同一件事
把十几个功能并排放在一起看,会发现它们底下有一个共同的东西。
它们都在解决人作为协作主体的缺陷。
信息汇拢,解决的是「人的注意力是局部的」。如果协作主体是注意力无限的完美主体,不需要把信息物理性地汇拢。
判断校准,解决的是「人的判断会固化」。如果协作主体的判断永远稳定,不需要外部碰撞。
责任锚定,解决的是「人会逃避责任」。如果协作主体永远诚实,不需要公开见证。
共同记忆,解决的是「人的记忆会重写」。如果协作主体的记忆完美,不需要现场共同确认。
让沉默的人被听到,解决的是「人会被社会压力压住」。如果每个协作主体都会主动表达判断,不需要被点名。
情绪出口,解决的是「人会被情绪干扰」。如果协作主体没有情绪,不需要这一项。
演练权力结构,解决的是「人不会自动认同集体」。如果协作主体天然认同自己在组织里的位置,不需要反复演练。
每一个功能都可以追溯到某种缺陷。它们之间彼此重叠、混在一起发生,但共同点是都不在处理协作的核心动作本身,处理的是协作主体不完美之后产生的外围成本。
显式仪式整个就是一套为有缺陷的人发明的协作脚手架。它不是为协作的核心动作(信息流动、判断形成、决定执行)设计的,这些动作本身简单。它是为了纠正承担这些动作的人的缺陷而设计的。
仪式的密度,和它要承担的缺陷量成正比。
一个由完美认知主体组成的团队,需要零仪式。一个高认知、互信、判断稳定的小团队,需要极少仪式。一个认知能力参差、互信低、判断不稳定、有派系、有政治的大组织,需要大量复杂的仪式。
高杠杆小团队里的仪式
把这个判断推到一个具体的场景。
三五个人的小团队。每个人都是高认知能力的判断者。每个人都用 AI 把自己的产出能力放大几十倍。他们之间高互信、判断风格相近、方向大致对齐。
这种团队里,前面列的那些仪式还需要吗?
周期性协调仪式(周会、双周会、月会)
这一类首先没用。
表面的原因,小团队信息透明。三五个人之间没有需要定期被强制汇拢的信息,需要知道的早就知道了。
但还有一层更深的。
周期性协调的内在假设是工作产出是线性的、可预测的、每周大致等量推进的。所以每周开一次会同步进度是合理的。
在高杠杆个体身上这个假设失效。一个用 AI 做杠杆的判断者,产出是脉冲式的。一个上午可能完成过去一周的工作量,几天可能推进完过去一个团队几周的工作。接下来一周毫无可见产出,因为他在生产新的工具、在思考一个难题怎么解决、在等一个判断成熟。
循环的节奏由具体问题的结构决定,不是由日历决定。
周期性协调仪式强加一个外部节奏在真实产出节奏之上。在高产出时期它打断循环(刚进入状态就开会);在思考期它制造伪进展(在会议上汇报「我在思考某个问题」作为进度)。
更深的问题:周会强迫产出脉冲符合日历周期。一个判断者为了「下周一有东西可以汇报」,可能强行收尾一个本应该再多发酵几天的思考,或者强行启动一个本应该等到下一个脉冲到来的新工作。仪式不只是消耗时间,它在反向扭曲产出节奏本身。
状态汇报(向上汇报、status update、周报、月报)
这一类也没用。
状态汇报的内在假设是「上级没法直接观察下级的工作状态,必须用一份定期产物来证明工作在发生」。
在小团队里这个前提不成立。三五个人天天一起做事,谁在做什么、做到哪了、卡在哪里、需要什么帮助,每个人都看得见。
如果系统层做得到位(共同记忆、可见的工作状态),上游想知道下游的状态直接看系统就行,不需要下游定期生产一份描述自己工作的文档。
周报作为一种产物对真实问题本身没有产出价值,它的唯一功能是让没参与工作的人感觉自己在 loop 里。这个功能在协作主体足够少、信息足够透明的语境下不需要存在。
评审会、立项会、终审会
这一类也没用。
这些仪式的存在前提是「决策需要一个正式的、可见的、有程序的场合」。所以一个 idea 要过 idea review、一个项目要过 project review、一个上线要过 launch review。每一道都有相应的人到场,按相应的格式呈现,得到相应的批准。
在小团队里,决定是几个人直接做出来的。「我们要不要做这个」这件事,相关的两三个人坐下来谈半小时就定了。不需要立项会,不需要 idea review,不需要上线评审。
这种决定本身不被外部仪式承载,就发生在小团队的日常协作里。
对齐会、跨部门协调会
这一类不存在,因为没有部门。
小团队里所有人都对所有事的整体负责。没有「我这边」和「你那边」,只有「我们要做的事」。所以跨部门对齐这件事在结构上不存在。
复盘
这一类形式变了。
复盘本身是有价值的。一件事做完了,回头看它为什么变成这样、做对了什么、做错了什么、下次怎么不一样,这种回看在任何团队里都需要。
但工业组织的复盘是仪式化的:定时间、所有人到场、有议程、有记录、有改进措施。
小团队的复盘不像仪式。几个人坐下来聊半小时,问几个具体问题,聊完散。产出不在那一份要归档的文档,而在每个人脑子里对自己判断质量的更新。
形式从仪式变成对话。
剩下还需要什么
如果上面这些都不需要了,剩下还需要什么?
问题驱动的高密度小会议。
几个人遇到一个真正难的判断,立刻聚到一起,专注地把这件事谈透,然后散开。可能 30 分钟,可能 3 小时。但它的性质不在仪式,而在一次集中作战。
它和周会不同。周会是定期的、按日历的、不论有没有事都开。问题驱动的会议是按需的、按问题的、谈完就散。
它和评审会不同。评审会是程序性的,要求 deck、要求按议程走、要求所有相关方到场。问题驱动的会议没有 deck、没有议程,只有相关的人到场。
它和对齐会不同。对齐会的目的是让所有人朝同一个方向走,让分歧消失。问题驱动的会议反过来,目的是让真分歧被看清楚。把信息差、视角差消除掉之后,剩下的就是真分歧。它不能也不应该被强行抹平,应该被识别出来、被严肃讨论。
这种会议在工业组织里也存在,但它通常被淹没在大量的程序性会议之间,难以被看见。把程序性的拿掉,剩下的就是这一种。
它是仪式之外的东西,不是仪式的变体。
回到下午两点那场会议。
如果把那十二个人和那一个半小时换成一个不同的场景:会议的主题从「过 PRD」变成「这件事我们到底要不要做、做的话最大的不确定性在哪、要押什么样的资源」。到场的从十二个人变成真正需要做这个判断的三个人。会议不按日历定,而是发现这件事真的难、需要专注谈一次而临时拉起来的。会议不需要 ppt 或飞书文档,因为相关的几个人手里已经有完整的上下文。上下文不靠会前花两小时准备一份 deck 拼出来,而是日常工作里持续维护着的。会议不需要纪要,因为结论本身就被工作流自动记录下来。
会议大概持续 40 分钟。结束的时候,三个人都对这件事的判断有了新的清晰度。其中一个人接下来一周会去做更深入的分析,另一个人会和外部某个角色沟通一次,第三个人在等前面两件事的结果之前先推进另一件事。
下午两点四十分,这三个人各自回到自己手头的事上。
接下来一周里,他们不会再为这件事开会。
第三章 · 沟通
下午六点。
那个产品经理终于结束了她的会,发来消息:「刚结束,可以聊了。」
打开飞书准备和她对那几个 PRD 的问题,发现这一天里未读消息有 142 条。
往上翻。
群里的对话从早上九点一直延续到现在。中间穿插着六个 @ 你。第一个 @ 是上午十点,老李问一个数据接口的事,标题是「【紧急】」。点开看,是一个内部测试环境的小问题,可以等他自己排查。第二个 @ 是十一点,市场那边的同事转了一个客户的反馈,标题是「【重要!需要立刻回复】」。点开看,客户问的是一个产品功能上的小疑问,市场自己就能答。第三个 @ 是下午一点,HR 提醒填一份表格,标题是「【今天必须完成】」。点开看,表格的截止日期其实是下周五。
剩下三个 @,都是「@ 全体成员」的群发,转发某个内部公告、某个全员邮件、某个领导讲话的链接。
142 条消息里,真正需要回应的有 3 条。其他 139 条要么是噪音,要么是已经被群里其他人处理掉的,要么是看起来重要但实际上根本不用管的。
但要从 142 条里挑出那 3 条,需要把每一条都点开看一眼。
这是一次沟通的现状。
第二章讲的是仪式:专门设立的、有明确开始和结束的协作动作。这一章讲沟通:协作的背景流。
仪式是离散事件,沟通是连续的流。一次会议是仪式,会议之前用 IM 发的提醒是沟通。一份周报是仪式素材,写周报时和同事在 Slack 上确认细节是沟通。仪式有边界,沟通没有边界。它渗透在工作的每一分钟里。
两件事的功能不同,但根源是同一件事。
沟通承担的事
把工作日里发生的所有沟通拆开看,承担的事大致是这些。
信息的连续传递。仪式只在特定时刻发生,但信息流动不能等到下次开会才进行。日常的进度同步、状态更新、临时变动,这些信息靠沟通在事件之间流动。
状态的实时感知。一个协作者卡在哪里、需要什么、什么时候有空,这些状态不靠开会汇报来,而是日常沟通里渗出来的。Slack 上一条「这个我得查一下」,IM 里的一个「我先睡了」,都是状态信息。
微小请求的处理。每天有大量小请求:「这个数据在哪里」「上次那个客户叫什么」「方案的最新版是哪个」。这些请求不可能每个都开会,靠沟通解决。
灰色地带的协调。仪式覆盖不到的临时情况,突然冒出的小问题、跨团队的临时配合、上下游的实时对接,靠沟通来补。
关系的持续维护。「最近怎么样」「周末干嘛了」「家里都好吗」这些对话表面看是闲聊,底下是在维持协作者之间的人际信任。没有这一层,工作上的协作会越来越冷、越来越机械。
情绪的低密度释放。仪式提供集中的情绪出口,沟通提供分散的、低密度的释放。一句「这件事真的让我很烦」、一个抱怨的表情,都是情绪在被低成本释放。
共鸣和归属感。「我也是这么想的」「同感」「这件事确实难」,这些小确认让协作者感觉自己在一个共同体里。
默会的积累。长期沟通让协作者对彼此的判断风格、表达习惯、底线产生预判。一个人长期共事之后,对方一开口你就大致知道他要说什么、他在意什么、他会怎么处理,这种默会是沟通的长期产物。
信任的累积。信任不会一次性建立,它在大量小尺度的沟通里被反复确认。每一次说到做到、每一次靠谱地接住一个小请求,都在加厚信任的底子。
沟通解决的也是人的缺陷
把上面这个清单和第二章仪式的功能清单并排放在一起看,会发现它们底下都在做同一件事。
沟通解决的也是人作为协作主体的缺陷。
信息的连续传递,解决的是「人的记忆不可靠、信息会过期」。如果协作主体的记忆完美、信息永远 ready,不需要持续地传递。
状态的实时感知,解决的是「人对别人在做什么没有直接通道」。如果协作主体能直接感知彼此的状态,不需要靠 Slack 上的只言片语去推断。
微小请求的处理,解决的是「人没法预知所有需要协作的小事」。如果协作主体能在开始时预见所有未来的协作需求,不需要日常的临时请求。
关系的持续维护,解决的是「人对陌生人天然有信任成本」。如果协作主体之间没有信任问题,不需要靠日常对话去暖关系。
情绪的低密度释放、共鸣归属感,解决的是「人有情绪、需要被看见」。如果协作主体没有情绪、不需要归属感,不需要这一层。
默会的积累、信任的累积,解决的是「人对彼此的判断风格需要长期学习」。如果协作主体能瞬间互相理解,不需要靠时间慢慢积累。
每一个功能都对应一种缺陷。和仪式的清单是同构的。
但有一个细微的差别。
仪式解决的缺陷更多是认知性的,记忆、注意力、判断、共同所指。这些缺陷可以被技术大幅外化。
沟通解决的缺陷里有相当一部分是人际性的、社会性的,关系、信任、情绪、归属。这些缺陷的外化难度大得多。
即使一切认知性缺陷都被系统外化掉,沟通承担的人际功能仍然需要某种形式的存在。它的形态会变,但不会消失。
沟通工具的爆炸
工业时代发展出的沟通工具远比仪式更多。
邮件、电话、即时通讯、视频会议、群聊、协作文档评论、看板、工单系统。每一种工具的发明,都伴随着「这次终于可以解决沟通问题了」的承诺。Slack 在 2013 年发布时的广告语是「Be less busy」。Microsoft Teams 在 2017 年推出时被定位为「让团队协作更轻松」。飞书在 2019 年的 slogan 是「先进团队,先用飞书」。
实际发生的事情和这些承诺正好相反。
Microsoft 2025 年的 Work Trend Index 给出的数字:平均员工每日收到 117 封邮件和 153 条 Teams 消息,总共 270 次中断,还不算会议和 @提醒。员工平均每 2 分钟被打断一次。每天 275 次中断。每次中断之后,重新进入深度状态平均需要 23 分 15 秒(这个数字来自 Gloria Mark 在加州大学欧文分校的长期研究)。
把这些数据放在一起算一下。
如果一个人每天 8 小时工作,被打断 275 次,每次需要 23 分钟回到深度状态,理论上他需要 6325 分钟的恢复时间。这是 105 小时。他没有这么多时间。所以实际发生的事情是:他每次被打断后从来没有真正回到深度状态,他的整个工作日都处在「浅层注意力」状态。
RescueTime 的数据:知识工作者每天能不被打断的连续时间,平均只有 1 小时 12 分。
Slack 自己公布的数据:一个 Slack 用户每天发 92 条消息,每天查看 13 次。平均每个用户在 Slack 上的活跃时间是 1 小时 42 分钟。
加起来:一个白领每天处理大约 270 条沟通信息,被打断 275 次,活跃在沟通工具上的时间超过 2 小时,能不被打断的时间不到 1.5 小时。
沟通工具被发明的初衷是减少邮件、减少会议。实际结果是邮件没有减少(甚至更多),会议没有减少,新的沟通量爆炸性地叠加在旧的之上。
新工具没有替代旧工具,是叠加在旧工具上。
AI 进来之后
在 AI 进入工作流之前,沟通的低效已经到了上面这个程度。
AI 进来之后,事情变得更复杂。
发起沟通的成本归零。
过去发起一条沟通有成本。组织语言、措辞、考虑收件人会怎么读、在意自己的声誉。这些成本本身是一种过滤器,它让人不会随便发起沟通,因为每一条都要付出一点认知代价。
AI 把这层过滤器拆掉。「帮我给老板写一封询问 X 项目进展的邮件」「帮我润色一下这段话让它显得更专业」,发起一条沟通的认知成本接近零。
过滤器一旦消失,沟通量就开始膨胀。一个本来不会被写的提醒、一封本来不会被发的客气邮件、一段本来在脑子里就解决了的纠结,现在都可以被低成本地变成一条 Slack 消息或一封邮件发出去。
内容自动专业化。
AI 写出来的消息都很「得体」「完整」「专业」。开头有恰当的问候,结尾有恰当的祝福,中间的论点结构清晰、措辞工整。
但这种得体本身是一种信息密度的稀释。一封 AI 写的 200 字邮件,传达的核心信息可能值 20 字。读的人要从 200 字里抽出 20 字。
AI 写 AI 读的循环。
事情推到极端是这样的。
人写 20 字,AI 扩成 200 字,发送,对方的 AI 把 200 字压缩回 20 字,对方读。
中间的 200 字大部分是损耗。但每个人都觉得自己「做了沟通工作」。发件人写了一份得体的邮件,收件人读了一份认真的内容,AI 在两端各自尽职地完成了翻译和压缩。
唯一被消耗的是网络带宽、token 预算,和两边人短暂的注意力。
这个循环正在所有用 AI 处理沟通的组织里悄悄发生。
重要性的通货膨胀
但 AI 时代沟通失效的最深问题,不是量的膨胀,也不是内容的稀释。
是重要性这个标记本身在贬值。
货币通货膨胀的机制:货币发行量增加,单位货币购买力下降,同样一笔钱能买的东西变少,人们必须持有更多货币才能维持原来的生活。
把这个映射到沟通上。
「重要」这个标记被滥发。
每条消息都标 @、都标紧急、都标「请尽快回复」、都用「重要」「关键」「优先级高」「ASAP」的措辞。原本「重要」这个标记是稀缺的,发出来意味着「这件事真的需要你停下手头的事来处理」。当所有人开始把所有消息标成「重要」,「重要」这个标记的购买力就被稀释了。
接收方的反应是贬值响应。看到「重要」不再立刻处理,因为大部分「重要」其实不重要。看到 @ 也不立刻看,因为大部分 @ 其实不需要你做什么。看到「紧急」反而推迟处理,因为「紧急」已经变成了发送方的措辞习惯而不是真实信号。
接下来是军备竞赛。发送方发现「重要」不管用了,开始用更强的标记,「非常重要」「极度紧急」「必须今天」「老板要的」「客户在催」。这些更强的标记很快也贬值,发送方又要找新的更强的标记。
回到第三章开头那个画面。下午六点打开 Slack,142 条消息,6 个 @。第一个 @ 标题是「【紧急】」,第二个是「【重要!需要立刻回复】」,第三个是「【今天必须完成】」。而真实情况是,没有一个真的紧急,没有一个真的需要立刻回复,没有一个真的必须今天完成。
通货膨胀的终点是所有标记都失去意义。
接收方不再相信任何标记,只凭自己的判断决定处理顺序。但接收方的判断带宽有限,所以大量真正重要的事情被淹没在噪音里漏掉。
这背后既没有发送方的恶意,也没有接收方的迟钝。它是一个所有人理性参与的、不可避免会发生的系统性贬值过程。
每个发送方都有动机标高自己消息的重要性。标高了对方更可能优先处理。这个动机在个体层面是理性的。但所有人都这么做,系统层面就崩塌。这是一个典型的公地悲剧:重要性是一种公共资源(信号系统的有效性),每个人滥用它对自己有利,但所有人滥用它会摧毁这个资源。
AI 加速了通货膨胀
AI 进入之前,发送一条「重要消息」还有一定成本。
组织语言要付出认知成本。声誉要被关心(一个总是说「紧急」但其实不紧急的人,会被同事记住)。「狼来了」的后果存在(如果几次「紧急」之后没人当回事,发送者自己会意识到要节制)。
AI 之后,这些成本接近零。
组织语言,AI 几秒钟写完。声誉,每个人都在用 AI,没人单独被指责。「狼来了」后果,消息太多了,没人记得你上次的「重要」是不是真的重要。
节制机制全部失效,通货膨胀加速。
更糟的是,AI 写的消息天然带有「专业感」「正式感」「重要感」。本来一句「这个数据明天发我」就够的事,AI 给出的版本会先有一句寒暄,再把请求展开成两三句完整的话,最后补一句「如果有任何问题随时和我同步」。每一处都得体,但整体把一件小事拉成了一件正式的事。
每一个 AI 写的消息都在偷偷地把自己标得比实际更重要。
通货膨胀从「人主动滥用标记」升级到「工具自动产生通货膨胀」。
不只是「重要」
再想一步,会发现重要性的通货膨胀只是一个更大现象的子集。
AI 之后正在通货膨胀的标记还有几个。
「专业」。每份文档都看起来专业。AI 让一个没有专业背景的人写出看起来很专业的内容。专业感失去了筛选作用。
「深度」。每篇分析都引经据典、考虑全面、看起来深思熟虑。AI 让浅层思考也能呈现出深度的外观。深度感失去了识别价值。
「真诚」。每封邮件都有恰当的开头问候和结尾祝福,每条消息都用了恰当的语气和情绪表达。真诚感失去了温度。
「思考」。每个回复都看起来经过思考、有结构、有论据。AI 让快速产出的内容也带有思考的痕迹。思考的痕迹失去了价值。
「努力」。每个产出都看起来精心制作。AI 让低成本的产出也能呈现出努力的外观。努力的可见性失去了说服力。
所有这些原本承载区分性的标记,「这个比那个更重要」「这个比那个更专业」「这个比那个更有深度」「这个比那个更真诚」「这个比那个更经过思考」,都在通货膨胀。
所有可以被 AI 模仿的「质量信号」都在贬值。
剩下还有区分性的,是 AI 还模仿不了的东西:真正的判断、承担、代价。这和 Issue 1 讲的认知去耦能力指向同一个核心,只是从产出端反向看到的另一面。
可信信号成为稀缺资本
通货膨胀的反面是通货紧缩,稀缺、购买力上升、被珍视。
在沟通的通胀环境里,真正稀缺的不再是信息,而是「确实重要」的信号。
一个能够发出可信的「确实重要」信号的人,他的信号会被高度重视。当他在 Slack 上说一句「这件事请优先处理」,接收方会真的优先处理,因为这个人的过往记录里,每一次「请优先处理」都对应着真正重要的事。
这是一个反直觉的资源分布。表面上大家都在发消息(信息泛滥),但底下「可信的重要性」是极度稀缺的。少数能发出可信信号的人或团队,在这种环境里反而拥有了一种新的稀缺资本。
这种稀缺在小团队里特别明显。
高互信小团队的内部沟通,每条消息都被信任、都被认真处理,因为发送方有过往的可信记录,他们的「重要」标记没有被滥用过。这种团队的沟通成本极低,因为信号系统没有崩塌。
而大组织里 95% 的沟通损耗,本质上是信号系统已经崩塌之后的代偿行为。因为你不知道哪条消息真的重要,所以你必须看每一条。
这就回到了第二章末尾那个判断的延伸。仪式的密度和缺陷量成正比,沟通的密度也和缺陷量成正比,但沟通还多了一层:沟通的有效性和信号系统的可信度成正比,和信号系统的崩塌程度成反比。
工业组织的沟通信号系统已经崩塌。AI 在加速这次崩塌。
高杠杆小团队里的沟通
把上面那些问题,沟通量爆炸、重要性通货膨胀、信号系统崩塌,放在三五个人的高互信小团队里,大部分都不成立。三五个人的内部沟通量天然不会大。每个人的「重要」标记没有被滥用过,信号系统没崩塌。
但这不意味着高杠杆小团队就没有沟通问题。它有另一组问题,是工业组织没有的。
如果每个人都有自己的 AI,每个 AI 都有自己的上下文、记忆、判断历史,那么两个判断节点之间的协作是不是仍然要靠人来做中介?两个 AI 之间能不能直接交换判断?
如果团队成员的工作状态本可以被系统持续维护起来,那么「我在做什么」「我卡在哪里」「我什么时候有空」这些状态广播是不是不再需要靠 IM 一条条发?
如果每个人手里都有大量未成型的思考、不便公开的判断、纯粹的发泄,那么私有空间和共享空间的边界由谁来管?
如果对外的世界还在按工业组织的方式运转,那么对外的沟通负担怎么不反向吃掉判断节点的时间?
这些问题工业组织不会遇到。它们是新形态在成形的过程中要面对的真问题。
工业组织的沟通问题是沟通量爆炸加信号系统崩塌,靠减少沟通解决不了。高杠杆小团队的沟通问题是沟通需求仍然存在,但承载它的形式还没有成形。
两者要被解决的方式完全不同。
回到下午六点。
那 142 条消息、6 个 @、3 条真正需要回应的事,是工业组织沟通信号系统崩塌的一次具体显现。
不是发件人不专业。不是接收方不认真。这套系统从设计上就要求每个人都参与一场无法停止的通货膨胀,每个人都在被这场通货膨胀吞掉。
下班的时候,回想这一天,会觉得自己一直在沟通,但又说不上具体沟通了什么。
这种感觉不是个人的问题。
第四章 · 关于工作的工作
周五下午五点。
一周结束了。打开日历回头看一下这一周做了什么。
周一上午开过 P0 项目的会,下午开过 P0+ 项目的会。周二上午 review,下午 1:1,晚上跨部门对齐。周三全天都是 onsite,和外部合作方过完合同条款过技术方案过上线计划。周四上午写周报,下午做季度规划的 deck,晚上参加全员大会。周五上午是项目 kickoff,下午是这周的复盘加下周的 planning。
日历上是密密麻麻的彩色方块。
把所有方块加起来算一下时间:会议本身大约 18 小时,会议准备(看材料、写 deck、列议程)大约 8 小时,会议后的 follow up(写纪要、跟进 action items)大约 4 小时,Slack 和邮件大约 12 小时,写各种文档(周报、季度规划、项目方案)大约 6 小时。
加在一起 48 小时。一周的有效工作时间大约 50 小时(加班加上去的)。
剩下 2 小时,真正在做这周该做的事的时间。
下班路上想了一下,这周到底产出了什么?
想不起来。
这是工业组织里大部分白领的真实状态。
数字不是夸张。Microsoft 2023 年覆盖 31 个国家、三万一千名全职员工的调研给出的画面是:平均员工 57% 的工作时间花在沟通(会议、邮件、聊天)上,43% 花在创造(文档、表格、演示)上。Asana 的调研把这画面切得更细:60% 协调、27% 基于技能的工作、13% 战略规划。换一种说法:一个白领工作日里,真正用来做判断和生产的时间,大约只剩下 40%。
但 40% 是「真产出」的乐观估计。这 40% 里还有一部分是写仪式素材,会议要用的 PPT、要交的周报、要走流程的文档、要存档的复盘。这些算不算「创造」?技术上算,因为它们是「在文档、表格、演示工具里产生的内容」。但它们的生产不为某个真实问题的判断和决定,而为某个仪式的运转。
把这部分剥离出来,能算作真产出的时间会更低。
仪式素材清单
围绕显式仪式,工业组织生产着一整套素材。
议程类:会议议程、kickoff brief、立项书、问题清单。
同步类:PRD、design doc、技术方案、产品规格。
状态类:周报、月报、季度报告、status update、OKR 进度更新。
结论类:会议纪要、决策记录、action item 跟踪表。
沉淀类:复盘文档、post-mortem、案例库、最佳实践。
协调类:项目计划、Gantt 图、RACI 表、依赖矩阵。
说服类:提案、pitch deck、business case、立项 PPT。
这是一个完整的产业链。从写、审、改、审批、发出、归档、被引用、被翻出来重新讨论,每一份素材都有自己的生命周期。
每一类素材都对应仪式的某一个时间切片。
议程类把仪式延伸到事前,让参与者提前知道要讨论什么。状态类、结论类把仪式延伸到事后,让没参加的人知道发生了什么。同步类把仪式的影响延伸到没参加仪式的人,他们要靠 PRD 理解决定。沉淀类延伸到下一次类似的事,让经验跨越具体事件被传递。
仪式本身只发生在那一两个小时里。素材让仪式的影响跨越时间和空间。
素材在解决的事
把每一类素材对应到它解决的人的缺陷。
议程类:人的注意力是局部的,不预先把要谈的事钉住,会议会变成漫谈。
同步类:人会假设性对齐,必须把所指落到一个共同的物理对象上(一份 PRD),多人对同一对象才有共同理解。
状态类:人对别人的工作没有直接观察的通道,必须用一份定期产物来证明工作在发生。
结论类:人的记忆会重写,没有可视的物理对象,事后会按各自的版本回忆。
沉淀类:人的经验会随人流失,必须把它脱离个体留下来。
协调类:人对分工的理解会模糊,必须明示「谁做什么」。
说服类:人的判断不通用,必须翻译给另一个判断者才能让他接受。
每一类素材的存在都有理由。它们的发明并非来自工业组织里某个 PM 闲来无事,而是为了纠正人在协作中的某种缺陷。
但它们的存在有代价。
素材的成本
Doodle 的调研:员工平均每周花 4 小时准备状态汇报类会议。注意这是「准备」,不包括会议本身。
GfK 和 Made in Office 联合做的一项调研覆盖了 1000 多名办公室人员,发现一个普通员工每月在 PPT 上花的时间,仅在版本管理和素材重复使用这一项,就有约 7 小时的优化空间。
在更大的尺度上,几项综合调研给出的画面:知识工作者每年人均花 209 小时在重复劳动上,352 小时在讨论工作而不是做工作上,103 小时在被自己判定为不必要的会议上。
把这几个数字加起来:
103 小时 + 352 小时 + 209 小时 = 664 小时
按一天 8 小时算,相当于 83 个完整工作日,一年 250 个工作日里的 1/3。
这是一个白领一年里花在「关于工作的工作」上的时间。它们不用来做事,用来配合仪式和沟通的运转。
如果再加上 Doodle 那个数据,每周 4 小时准备状态汇报会议,一年 200 小时,以及大量没被这些调研覆盖的素材生产(写 deck、写 PRD、写技术方案、写复盘、做季度规划):
实际花在仪式素材生产消费上的时间,可能占到一年总工作时间的 40% 以上。
加上仪式本身(会议、汇报、评审)的时间,加上沟通工具(邮件、IM)的时间,剩下用来做真正的事的时间,确实就只有那 2 小时了。
用 AI 加速旧素材
AI 进入工作流之后,大部分公司做的事情是让 AI 帮忙写这些素材。
让 AI 写周报、写 PRD、写会议纪要、写 deck、写复盘文档、写季度规划。每一件事都能比手写快几倍到几十倍。市场上出现了一大批「AI 帮你写周报」「AI 自动生成会议纪要」「AI 一键做 PPT」的工具。每一个都有自己的用户群和增长曲线。
这套逻辑听起来很合理。仪式素材是必须的,因为仪式还在运转,仪式需要素材。人写素材很慢,因为这些素材本来就不是产出,是配合产出的开销。AI 写得快,因为它就是为这种结构化、模板化的写作设计的。
所以 AI 帮忙写素材,让大家从「关于工作的工作」中解放出来,去做真正的事。
这个逻辑听起来很合理。
但它错了。
错在它默认了一件不该被默认的事:仪式素材的存在是合理的、必要的、应当被保留的。
加速一件本来不该存在的事
仪式素材的存在前提是协作主体有缺陷。前面已经一项一项推过了。议程对应注意力局部性,PRD 对应所指不一致,周报对应观察成本高,纪要对应记忆会重写。每一类素材都是为了纠正人的某种缺陷而被发明的。
如果协作主体的缺陷被外化到系统层:
记忆缺陷被持续维护的共同记忆吸收。所指不一致被结构化的共同对象吸收。观察成本被透明的工作状态吸收。经验流失被沉淀进系统的过程记录吸收。
那么仪式素材本身就不再需要存在。
不是「写得更快」,是「不需要写」。
用 AI 加速周报的生产,让一周的周报从两小时变成二十分钟,这看起来是效率提升。但它的内核是把「让上级感知到下级在工作」这件事的成本稍微降低了一点。
周报对真实问题本身没有产出价值。它的全部功能是让没参与工作的人感觉自己在 loop 里。如果共同记忆已经让上级直接看到下级的工作状态,周报这件事就该消失,而不是被 AI 写得更快。
让 AI 写 PRD,让一份 PRD 的生产从一天变成一小时,这看起来是效率提升。但它的内核是把「让多人对同一对象达成共识」这件事的成本稍微降低了一点。
PRD 的存在前提是「一群人需要对一个尚未存在的对象达成共识,然后分头做」。在高互信小团队里,对象的形态在做的过程中不断变化,做的人和判断的人重合度很高,AI 让原型化的成本骤降。与其先写一份完整的 PRD 等所有人对齐,不如直接做一个粗的原型让大家看着改。同步发生在物体本身上,不发生在描述物体的文档上。
这是一个深的认知错位:
用 AI 加速旧素材的生产,是在加速一件本来不该存在的事。
AI 没有改变协作的根本机制,AI 让协作里那些为了兜住人缺陷而存在的环节,运转得更快。但运转得更快的那些环节,本身就不该被运转。
加速一件本不该存在的事,等于把更多的资源投入到一件没有产出价值的事上。账面上看是效率提升,实际上是把生产力错配到错的地方。
不是所有素材都是表演
要诚实地把话说清楚:不是所有素材都是表演。
需要分两种情况。
给自己看的素材:周报、内部 PPT、内部复盘、内部立项文件。这些素材的功能是「让公司内部觉得我们也在做规范工作」,是表演给上级、给同事、给流程看的。
这类素材的真实价值在高互信小团队里接近零。系统层做得到位之后,它们应该消失,而不是被加速。
给外部看的素材:给客户的方案、给合作方的合同、给投资人的 deck、给监管的合规报告、给公众的对外披露。这些素材的功能是「让外部世界能接受我们的工作」。外部世界还是按工业组织的形态运转,他们需要按他们能接受的形式看到东西。
这类素材是真实需求。它们不会因为我们内部用了 AI 就消失。但它们可以被最小化:只在真正需要时生产、由 AI 高效地生产、不让它们反向消耗判断者的时间。
两类素材的处理方式不同。给自己看的应该消失,给外部看的应该被压缩。混淆这两件事,是当下大部分组织在 AI 转型上的核心错位。
公司在内部用 AI 加速周报,员工写周报的时间从两小时变成二十分钟,节约出来的一小时四十分钟去了哪里?理论上应该投入到真产出。实际上往往进入新的仪式开销:开更多的会、写更多的 deck、被更多的 @ 占用注意力。
时间被节约了,但没有被解放。
回到周五下午五点。
打开日历,48 小时被仪式和沟通吃掉,剩下 2 小时是真产出时间。
如果让 AI 来加速这套机制,让 AI 写周报、写 PRD、写 deck、做会议纪要,48 小时里大概能省下 5 到 10 小时。
但省下来的时间不会自动变成真产出时间。它们会被新的仪式吃掉。既然写周报变快了,那就要求每周写两份。既然 PRD 变快了,那就要求每个 feature 都有 PRD。既然 deck 变快了,那就在每次汇报前都要做 deck。
仪式不会自动消失。它的存在前提还在,人作为协作主体的缺陷还在。AI 在替代人完成素材的生产,但仪式本身仍然需要被维持,因为它的功能是兜住组织里大量认知能力一般的人之间的协作摩擦。
只有当协作主体的缺陷被大规模外化,记忆被系统承担、所指被结构化、观察成本被透明化、经验被沉淀,仪式本身才会失去存在的对应物,素材才会跟着消失。
这是一个结构性的事。不是「用 AI 写更快的周报」能解决的。
第五章 · 一个数量级的估算
前面四章把工业组织协作机制的成本一项项铺开了。会议、汇报、复盘、评审,仪式素材的生产消费,重要性的通货膨胀,状态广播的开销。每一项单独看都有它的合理性,合起来看是一个白领工作日里 60% 的时间被吃掉。
如果把这套机制大幅压缩,会发生什么?
不是凭空想象。一个由高认知判断者组成、用 AI 把产出能力放大几十倍的小团队,已经能给出一个具体的答案。
这一章用一个粗的数学模型对比三种情况。当下的 100 人传统团队、独立的 3 人高杠杆小队、嵌在传统组织里的 3 人高杠杆小队。
先把一件事说在前面。下面的所有数字都是基于公开数据和实测锚点做的估算,不是严谨的科学计算。它们的用处是揭示数量级,不是给出精确预测。读它的方式是定性分析,不是工程参数。
模型是粗的,假设是保守的,数字是定性的。但量级是清楚的。
情况一:100 人传统团队
按前面引用过的几项调研,Microsoft Work Trend Index、Asana Anatomy of Work、APQC 知识工作者调研,综合下来一个白领的时间大致是这样花的:
- 真判断和真生产:27%
- 战略和方向性思考:13%
- 协调(会议、对齐、汇报):35%
- 仪式素材生产(写 deck、PRD、周报、纪要):15%
- 信息查找和上下文重建:10%
合计 100%。其中真产出时间(前两项加起来)大约 40%。
这里说的「真产出」,指的是直接推进问题判断、决定形成、或结果交付的工作。下面的模型里反复用到这个词。
一个 100 人的认知密集型团队,每人每天 8 小时,按 40% 真产出计算:
100 × 8 × 40% = 每天 320 真产出人时
按一周 5 天:
每周 1600 真产出人时
剩下的 60%(每天 480 人时、每周 2400 人时)被吃在协调、素材生产、信息查找上。
这是 100 人传统团队产出的基线。
情况二:独立的 3 人高杠杆小队
要算这种小队的产出,需要一个产出锚点。
笔者最近一个月在 Claude Code 上的实测数据:51 天里活跃 36 天,累计消耗 93.4M 非 cache token,日均 output token 约 895K。声明:这是单一样本,笔者本人是该领域的重度使用者,所以并非中位数样本,而是高熟练度、高密度使用的上沿场景锚点。它不能代表所有人,但可以说明:在使用强度的上沿,产出量级已经发生了什么变化。
895K output token/day 这个数字在不同任务上对应的产出量差异很大。两条独立的换算路径可以互相校验。
路径一:token 到产出的直接换算。
agent 输出的 token 里,并非每一个都进入最终产物。其中包含推理过程的中间产物、试错被丢弃的版本、refine 多轮的内容。保守估算 30% 真正进入最终产物:
895K × 30% = 约 268K 真产出 token/day
一个有经验的传统工程师一天能输出的有质量内容大约是 5K token(按照一天 400 行代码,每行 12.5 Token 计算)。
268K ÷ 5K ≈ 54 倍
路径二:任务加速比。
不通过 token,直接看任务完成量。基于行业从业者的报告和实测:
- 完整功能模块:传统 2-3 天,AI native 几小时(约 10-20 倍)
- 深度研究 / 调研:传统 1-2 周,AI native 1-2 天(约 5-10 倍)
- 深度长文写作:传统 1 周,AI native 1-2 天(约 5-10 倍)
- 原型 / MVP:传统 2 周,AI native 2-3 天(约 5-10 倍)
平均加速比保守取 10-20 倍。
两条路径的几何平均约 28 倍。保守取下限作为模型参数:
1 个 AI native ≈ 10-20 个传统工作者
接下来算 3 人独立高杠杆小队的产出。
独立态意味着没有传统组织的仪式束缚,没有强制周会、没有跨部门对齐、没有向上汇报、没有写给外部看的素材负担。但仍然有一些不可外化的协作成本:真分歧的对撞、问题驱动的小会议、对 AI 输出的审查、对系统记忆的校验、人际信任的维护。
这一部分大致占 15%,是协作里本质属于人的部分。
独立 3 人高杠杆小队的真产出时间占比:85%
每人每周真产出小时(按 AI native 自身工时):
3 × 40 × 85% = 102 AI native 人时/周
按 1 个 AI native ≈ 10-20 个传统工作者换算:
102 × 10 = 1020 等效传统人时/周(下限) 102 × 20 = 2040 等效传统人时/周(上限)
对比 100 人传统团队的 1600 真产出人时/周。
3 人独立高杠杆小队的周产出大约等同于 100 人传统团队。下限略低于基线,上限明显超过基线,中位接近基线。
情况三:嵌入传统组织的 3 人高杠杆小队
这是最锋利的一种情况。
很多公司在 AI 时代尝试组建小型 AI native 团队。设想是这样的:找几个高认知能力、会用 AI 的人,组成一个小队,让他们用新方式工作,但仍然嵌在公司的整体组织里。
这种嵌入态会发生什么?
小队仍然必须接入传统组织的协作流:
- 向上汇报(向不懂 AI 的领导讲他们在做什么、怎么做的、为什么这么快)
- 横向同步(向其他不 AI 的团队对齐、协作、解释)
- 流程合规(走传统公司的项目立项、评审、上线流程)
- 文档化(写出符合公司归档标准的 PRD、设计文档、技术方案)
- 解释和教育(不断回答「为什么这么快」「质量怎么保证」「AI 写的代码靠谱吗」)
- 风险背书(在传统的风险评审、合规审查里证明自己的工作)
这些动作单独看每一个都不大,合起来吃掉的时间相当可观。
把成本一层一层算下来。
第一层:直接时间损耗。
按典型估计,嵌入态下每人每周强制吃掉:
- 向上汇报:2-4 小时
- 横向同步:3-5 小时
- 流程合规:5-10 小时(按项目摊到周)
- 文档化:5-8 小时
- 解释教育:3-5 小时
合计:每人每周 15-25 小时(取中位 20 小时)。
按 40 小时工作周:
- 独立态:40 × 85% = 34 真产出小时/周
- 嵌入态:(40 - 20) × 85% + 20 × 0% = 17 真产出小时/周
单人真产出从 34 跌到 17,腰斩。
第二层:注意力碎片化损耗。
被强制接入传统沟通流之后,每天被打断的次数显著增加:临时同步、即时提问、紧急会议、各种 @。按每天被打断 4-6 次、每次损失 23 分钟深度状态计算,每天损失 1.5-2.3 小时深度专注,每周 7.5-11.5 小时。
和第一层的时间损耗有部分重叠。保守估重叠 50%,净增损耗约 4-6 小时/周。
单人真产出从 17 跌到 11-13。
第三层:判断质量损耗。
这是最隐蔽也最严重的一层。
高杠杆工作的判断质量依赖完整的上下文。被迫向外解释、汇报、文档化时,必须把完整上下文压缩成传统组织能接受的简化版本。这个压缩动作有三个副作用:
- 消耗判断者的认知带宽(压缩比判断本身还累)
- 引入失真(简化版本里丢掉的细节往往是判断真正依赖的东西)
- 反向污染判断(每次写「为什么这么做」会让判断者更难承认这个判断错了)
更糟的是,传统组织的反馈会反向影响判断。当一个领导基于简化版本提出质疑,AI native 要么花时间把上下文重建到能反驳的程度(极贵),要么妥协让步(判断质量下降)。
保守估算判断质量下降 20-30%。按 25%:
11-13 小时真产出 × (1 - 25%) = 8-10 等效小时/周
三层损耗叠加:
| 状态 | 单人每周真产出(AI native 小时等效) |
|---|---|
| 独立态 | 34 |
| 嵌入态:仅时间损耗 | 17 |
| 嵌入态:加注意力碎片化 | 11-13 |
| 嵌入态:加判断质量损耗 | 8-10 |
单人真产出从 34 跌到 8-10。损耗 70-76%。
三种情况的总产出对比
把三种情况放在一起:
| 形态 | 周产出(等效传统人时) |
|---|---|
| 100 人传统团队 | 1600 |
| 3 人独立高杠杆小队 | 1020-2040 |
| 3 人嵌入态高杠杆小队 | 240-600 |
或者用等价人数表达:
| 形态 | 等价于多少人传统团队 |
|---|---|
| 3 人独立高杠杆小队 | ≈ 100 人 |
| 3 人嵌入态高杠杆小队 | ≈ 25 人 |
成本对比
光看产出还不够,要看产出 / 成本。
按一线城市认知密集型工作的中位水平:
- 25 个传统员工年综合成本(年薪 40 万 + 综合系数 1.4-1.5):约 1400-1500 万
- 3 个高杠杆 AI native 年人力成本(年薪 100 万 + 综合系数 1.4):约 420 万
- 3 个 AI native 的 AI 使用成本(按 895K output token/day 推总 token,按中位模型定价):约 30 万/年
- 3 人 AI native 团队年总成本:约 450 万
ROI 对比(按等价的传统团队产出价值估算。这里假设一个 25 人传统团队的产出价值大致等于它的人力总成本,即市场理性定价下公司刚好打平):
| 形态 | 年成本 | 等价产出价值 | ROI |
|---|---|---|---|
| 25 人传统 | 1400-1500 万 | 1400-1500 万 | 1 倍 |
| 3 人 AI native 独立 | 450 万 | ≈ 5600 万(100 人价值) | 12 倍 |
| 3 人 AI native 嵌入 | 450 万 | ≈ 1400 万(25 人价值) | 3 倍 |
这些数字想说什么
模型推到这里,几件事变得清楚。
第一件事:工业组织里 95% 的人承担的是「算力填充」。
100 人团队里真正在产生判断的从来只是其中几个人。其余的人力承担的是什么?翻译、协调、传话、对齐、确认、跟进、生产仪式素材、配合流程运转、解释为什么、保证形式合规。所有这些动作的共同特征是它们不直接产出判断,它们让那几个真判断节点能在工业组织的形态里运转。
这部分人力在没有 AI 的时代是必须的,因为唯一能填充算力的就是更多的人。一个组织要做更多事,必须招更多人。
AI 进来之后,「人作为算力」这件事有了替代方案。所以 3 到 5 个人加 AI 算力,能完成原本 100 人才能完成的工作。
这不是 AI 让 95% 的人失业。是工业组织里 95% 的人力,被安排在了不直接产出判断的环节上,翻译、协调、传话、对齐、确认、跟进、形式合规。这些环节并不「错」,它们是必要的、但没有产出价值的,是为了让组织作为一种工业时代的形态能运转起来而存在的开销。
这些环节里的人并非没有能力做判断,而是岗位的位置不让他们做判断。换一个组织形态,同一个人的角色可能完全不同。
第二件事:3 倍 ROI 是一种隐性的失败。
在这个模型里,3 人 AI native 嵌入传统组织之后,从账面上看仍然是赚的。450 万的投入对应 1400 万的等价产出,ROI 是 3 倍。这个数字不算差。
所以公司高层经常觉得「我们也有 AI 团队,我们没有掉队」。
但被遮住的是另一种可能性。同样的 450 万投入,如果让这个小队独立运转,能产出的是 12 倍 ROI,对应 5600 万的价值。是嵌入态的 4 倍。
这个差距是隐形的。它不出现在 KPI 上、不出现在财报上、不出现在年度回顾里。它只出现在「如果这个小队独立运转会是什么样」的反事实里,而反事实是看不见的。
公司在看自己的 3 倍 ROI 时不会觉得有问题。但隔壁公司的 AI native 团队在按 12 倍 ROI 跑。一年下来,差距悄悄拉开。
差距不显眼的是当下哪一年,而是积累几年之后突然发现自己的认知密集业务被对手拉开了不止一个量级。
问题不在现在多差,在隔壁公司按 12 倍跑的时候,自己只在按 3 倍跑。
关于 Issue 3 那一章
Issue 3 第二章讲过协作池在收缩、生产体系不可通约。那一章给的是定性判断:AI native 工作方式和工业组织工作方式属于两种不可通约的生产体系,把它们硬放在一起协作会出问题。
这一章的数学模型给出了那个判断的量化版本:硬放在一起的结果是产能损失 70-76%,ROI 从 12 倍跌到 3 倍。
这两章的关系并非重复,而是定性诊断和量化诊断。Issue 3 描述了现象,这一章算出了代价。
模型的诚实声明
这个模型成立有几个前提条件,要明确说出来。
前提 1:AI native 的真产出比例真的能达到 85%。要求小团队基础设施完备(共同记忆、agent 协作、上下文持续 ready)、互信高、判断风格相近。
这 15% 不可外化的剩余物大致包含:真分歧讨论(约 5%)、问题驱动小会议(约 3%)、对 AI 输出的人工审查(约 4%)、对系统记忆的校验(约 2%)、人际信任维护和情绪表达(约 1%)。
这些并非缺陷,而是协作里本质属于人的部分。技术不能消除,也不应当消除。
前提 2:每个 AI native 的有效产出真的能达到 10-20 倍传统人时。锚点是 895K output token/day 的实测数据,且这些 token 是有产出价值、非垃圾、被人审过的。
这一条本身就需要「不可外化的剩余物」里的人工审查。AI 会犯错、会幻觉,人对 AI 输出的审查是必须的,不是临时缺陷。
前提 3:判断带宽足够覆盖业务。3 个 AI native 的判断带宽合起来能覆盖 100 人团队所有方向。如果是多业务线的复杂组织,可能需要 5-7 人。
前提 4:嵌入态损耗的估算假设传统组织没有对 AI native 做特殊保护。如果组织主动减少他们的仪式负担,损耗会下降,但不会消失。
前提 5:系统的可信度有上限。共同记忆有检索幻觉、AI 输出有错误、长链条任务会累积偏差。这些不会被技术彻底消除,所以人工校验是常态。模型里已经把这部分时间隐含进 15% 不可外化剩余物里。
模型并非预测,只是给一个粗的量级感。
数字不是用来精确地预言未来的。它是用来揭示一件事的尺度。
工业组织里一个 100 人的认知密集型团队,每周 1600 真产出人时,这是它的天花板。这个天花板的存在原因不在协作本身需要这么多人力,而在协作里 60% 的人力被用来兜住人的缺陷。
把人的缺陷大规模外化之后,3 个人加上 AI 算力,能产出同样的 1600 人时,前提是这 3 个人能在没有传统仪式束缚的形态下运转。
如果把他们硬塞回传统组织里,他们的产出从 1600 跌到 400。75% 被吃掉。
这不是这 3 个人的失败。是工业时代的协作机制和 AI 时代的工作形态在结构上不兼容。
第六章 · 要解决的事
第五章给的数字是 3 个人加上 AI 算力能完成 100 人的事。这个数字不是空想,但它的成立有一组具体的前提。
把那 3 个人的日常拉近一点看。
早上九点。
三个人各自开始一天的工作。他们之间没有「今早先开个站会同步一下」这种事。每个人坐下来打开自己的工作环境。这个环境并非公司的内部协作平台,而是一个连接着团队共同记忆、所有人的近期工作状态、和各自 AI agent 的统一工作空间。
A 打开之后看到的是:B 昨晚 11 点完成了那个数据接口的改造,没有未解决的依赖。C 今天早上在写一个新模块,已经卡在某个具体的设计权衡上一小时,刚才在系统里留下了一个候选方案。A 自己手头的事,上周三定下来的那个产品方向调整,还有几个判断需要做。
A 没有问任何人,没有发消息,没有打电话。他知道的这些事来自系统。
九点二十分,A 看到 C 卡的那个设计权衡,正好和 A 上周做过的一个判断有关。A 在系统里直接给 C 留下一段对那个权衡的看法,附上之前判断的上下文。C 的 agent 收到这段输入,会和 C 这边正在跑的方案做对比。等 C 上午十点真正坐下来处理这件事时,他面对的不再是「我卡住了」,而是「A 已经给出了一个角度,我的 agent 已经把这个角度和我的方案做了对比,我现在要在这两条路径里做一个判断」。
A 给 C 留下那段看法用了 4 分钟。C 上午处理这件事用了 25 分钟,做完判断,方案推进。
这 4 分钟 + 25 分钟,在工业组织里对应的是什么?
一个站会(30 分钟,但要等到第二天早上)。如果当天就要解决,是一次临时拉起来的会议(A 和 C 都要停下手头的事,至少 30 分钟)。会议前 C 要花 10 分钟把上下文整理成 A 能理解的形态,会议中 A 要花 15 分钟才能进入 C 的语境,会议后 C 还要花 10 分钟把会议结论整理成自己的下一步。
工业组织里同一件事大致需要 65 分钟的总耗时,且 A 和 C 当天的状态都被打断一次。
新形态下用了 29 分钟,没有打断。
这是数学模型里 10-20 倍人均提效背后具体发生的事。
但这种工作方式的成立,有一组必须被解决的问题。
共同记忆
第一件事是团队的共同记忆。
上面那个场景里,A 知道 B 完成了数据接口、C 卡在设计权衡,这些信息不靠 B 和 C 主动告诉 A,而是系统里持续维护着的。
要做到这件事,需要每个团队成员的工作过程能被彼此的 AI 直接访问。这种访问的对象并非事后整理出来的文档,而是工作流里自动沉淀的过程。判断、决定、对话、文档、代码、试错记录,这些上下文如果只留在每个人各自的 AI 里,团队就没法共享。
但要实现这件事有几个具体的难点。
私有和公开的边界。每个人都需要私有空间。一个还没成型的思考、一个对同事的负面看法、一个对客户的吐槽、一段纯粹的发泄,这些不能默认共享。共享什么、不共享什么,这条边界不能由系统硬性规定,必须每个成员自己掌握。
共享内容的检索。不是全文搜索就够了。要的是「另一个成员的 AI 在做相关判断时能自动调取」。共享之后的内容需要被理解、被结构化、被在合适的时机调取出来。这件事比把文档堆在一个 wiki 里难得多。
不一致的保留。两个成员对同一件事有不同记录时,系统不能强制对齐,要保留差异。判断的多样性本身有价值,系统不应该消除它。
人工校验机制。系统的记忆本身有幻觉。检索可能调取不相关的内容、可能丢失关键细节、可能把不同时间的判断混淆。在关键判断上人仍然需要自己再确认一次。这件事不可避免,要在工作流里给它留位置。
Agent 之间的横向沟通
第二件事是 AI agent 之间的直接通信。
回到 A 给 C 留下那段看法的场景。A 留下的是给「C 和 C 的 agent」一起看的内容。C 的 agent 收到之后,会和 C 这边正在跑的方案做对比、做交叉验证、做差异分析,这些工作发生在 C 真正坐下来看之前。
当前的 AI agent 都是孤岛。我用我的 agent,你用你的 agent,两个 agent 之间没有任何通道。如果一件事需要协作,必须通过人做中介:我告诉我的 agent、我把结果告诉你、你告诉你的 agent。三段路径。每一段都损耗一些上下文、丢失一些判断的细节、需要人重新组织语言。
要让 agent 之间能直接通信,有几个具体的难点。
通信的语言。不是自然语言(损耗大)、不是 API 调用(太结构化)。需要一种介于两者之间的形式,既保留判断的微妙性,又能被另一个 agent 高效处理。
代表权限。我的 agent 代表我说出去的话,是不是等同于我说的话?这件事的责任边界要明确。一个 agent 不能随意承诺、不能随意决策、不能在没有授权的情况下代表人做出有约束力的回应。
避免自循环。两个 agent 互相发消息可能产生无意义的来回,浪费算力不产生价值。需要让 agent 知道什么时候该停下来、什么时候该把决策交回给人。
人对 agent 输出的审查。这是和「人工校验机制」配对的另一面。agent 间通信不意味着人退出协作,人仍然需要审查 agent 的关键输出。AI 会犯错、会幻觉、会在边缘情况下做出错误判断。这件事短期内不会被技术彻底解决,所以人审查 agent 输出是常态。
可判断状态的持续维护
第三件事是上下文的持续维护。
A 早上九点打开工作空间的时候,面对的不再是一堆原始材料、不再是一份要花半小时读完的总结报告,而是一个「随时可以介入的判断面」。他知道现在在哪里、相关的变量是什么、上次的判断是什么、悬而未决的点在哪里。
具体的难点。
完整性和简洁性的平衡。完整意味着信息量大、判断者要花时间读。简洁意味着可能丢掉关键细节。中间的平衡不是固定的,要根据判断者当下要做什么动态调整。
自然的提醒机制。不是任务队列(太结构化、让人感觉自己是机器的输入端),不是 push notification(打断专注)。要的是「这件事到了需要你看一眼的时候」的自然提醒,既不打扰深度工作,也不让判断者错过关键时刻。
对系统记忆的人工校验。这件事在每一个用到系统记忆的地方都成立。判断者在关键判断时仍然需要自己再确认一次系统给的上下文是否准确。这是不可外化的成本之一。
过滤层
第四件事是输入流的过滤。
判断者面对的信息流里大量是噪音:姿态、情绪、存在感、风险转移、附和、泛泛建议、礼节性沟通。这些在工业组织里和真信号混在一起,每个判断者要自己花认知带宽过滤。
新形态下系统承担这层过滤。具体的难点。
识别噪音不能误伤。纯粹的「负面」过滤会漏掉重要的弱信号。一句听起来像抱怨的话可能藏着一个真问题,一段看起来无关的对话可能透露一个关键的情报。系统的过滤不能太激进。
保留可下钻的通道。被过滤掉的内容不能直接丢弃。判断者偶尔需要看「现在在底下流过的是什么」。系统应该让主流是高密度信号,但底层的完整原始信息仍然可访问。
过滤规则的动态调整。不同时期、不同项目、不同判断阶段,判断者关心的东西不一样。过滤规则不能是静态的,要随团队的工作状态调整。
判断的层级化呈现
第五件事是意见的层级化。
工业组织里每条意见的权重都是隐性的:谁说的、什么职级、什么背景,这些决定了一条意见被多认真对待。这种隐性的权重经常和真实的判断资格脱钩,但工业组织没办法解决,因为公开评估判断资格在政治上不可行。
新形态可以解决这个问题,但要小心怎么解决。
「资格基础」要可见,不是排序。每条意见出现的时候,能看到「这个人在这个领域的判断历史是什么样」「他这次发言基于什么信息」「他的判断和事实层的距离」。这是描述性的,不是评分性的。
不能变成竞争激励。一旦把「判断资格」做成评分,就会引入扭曲:人开始为了刷分发言,为了维持分数不敢挑战,为了在排名里靠前去做政治性表态。整个系统的诚实度会崩塌。
判断者保留最终决定权。系统提供的是输入的层级信息,不是结论。最后做判断的是人,不是系统的「资格分」。
表达性劳动的解耦
第六件事是判断和判断传播的解耦。
工业组织里一个判断者花在「把已经形成的判断翻译给不同对象」上的时间很多:给老板做 deck、给同事发 Slack、给客户写邮件、给监管写报告、给媒体准备 talking points。同一个判断,要被翻译成 N 个不同的形态。
这些翻译劳动不改变判断本身,但消耗判断者的认知带宽。每翻译一次,判断者对这个判断的承诺就被加深一些,后面如果发现判断错了,更难承认。
新形态里这层翻译被 AI 承担。判断者只需要把判断用最粗糙的方式说出来,系统翻译成不同对象需要的形态。
翻译不能引入失真。AI 翻译时容易加入自己的修辞、自己的语气、自己的「合理化」,让原意被稀释。需要的是高保真翻译,不是「让原作者看起来更专业」的翻译。
版本之间的核心一致。给老板、给同事、给客户的版本不同,但核心判断必须一致。不能出现「给老板说 A 给客户说 B」的精分情况。
关键对外内容人审一遍。完全脱手的翻译不可取。判断者要在关键的对外内容上做一遍最后审查,这是 AI 不能完全替代的人的责任。
对外的接口
前面六件事都是对内。最后一件事是对外。
这件事的立意要先说清楚:目标是压缩,不是杜绝。
外部世界不会因为我们用了新工具就改变形态。客户、合作方、监管、上下游、上位决策者,他们仍然按工业组织的方式运转。他们要开会、要看 PPT、要走流程、要见到人。
这件事不可能通过技术让对方消失。技术能做的是让小队承担这件事的成本最小化。
让 agent 承担对外对接的第一道层。客户的问询、合作方的提议、临时的会议邀请、流程性的需求、形式合规的素材生产,这些可以让 agent 接住、过滤、归类、生成、回应。不追求 100% 自动化,追求的是让人介入的频率和深度都被精确控制。
外部会议的三类压缩:
- 信息性会议(更新状态、同步进展):由 agent 提供 written briefing 替代,能不开就不开。
- 决策性会议(需要小队介入做决定):必须人参加,但 agent 准备所有上下文,把一小时的会压到二十分钟。
- 关系性会议(建立信任、维护客户关系):必须人参加,且不能压缩。这是真分歧和人际信任的近亲,靠技术解决不了。
上位和平行决策者的常规连接。一个组织里仍然有上下级和平行部门,小队不是真空运转。把小队的工作翻译成上位决策者能快速消化的形态、把平行决策者关心的部分主动同步出去、把上位和平行的反馈带回小队预处理之后再到判断者面前,这些都可以让 agent 承担。人的介入时机是真分歧、关键决定、关系建立。
节点之间的真分歧
最后一件事,是上面所有问题都解决之后剩下的。
3 到 5 个人的小队,即使共同记忆完整、agent 协作顺畅、对外有统一接口,仍然会遇到真分歧:对方向的判断不一致、对优先级的判断不一致、对人的判断不一致。
这件事 AI 解决不了。它是人际信任和判断对撞的核心。
agent 间的预校准可以把信息差、视角差消除掉。剩下的才是真分歧。它的处理需要时间、需要专注、需要彼此对对方判断的尊重,这些没有捷径,只有信任、对话、和愿意改变自己判断的开放。
这是协作里最不浪漫的一层:所有缺陷都被外化之后,剩下的就是人之间真正的判断差异。
这一层不应该被消除。它是组织的动力,也是组织最难的部分。技术能做的并非解决真分歧,而是为它的处理创造最好的条件,把所有外围的损耗清掉,让它能被清晰地看见、被认真地处理。
这不是技术乌托邦
上面七件事加一件不可外化的核心,是一个粗的清单。
清单不是答案。它是说,要做到第五章那个 3 人 ≈ 100 人的状态,具体有这么一组事需要解决。每一件事都是真实的工程问题、产品问题、组织问题。每一件事都没有现成的方案。
也要把适用边界说清楚。这一篇讨论的是认知密集型、低资本门槛、低强制监管的小团队协作。在医院、金融清算、航空、政府、制造业等强监管或强法律责任领域,大量仪式和文档不会消失,因为它们处理的并非认知缺陷,而是责任、风险、合规和外部信任。这些领域有自己的进化路径,不在这一篇的范围里。
承认几件事。
AI 会犯错。当前的模型会幻觉、会做错判断、会在边缘情况下出问题。这件事短期内不会被技术彻底解决。所以人对 AI 输出的审查是常态,不是临时缺陷。
系统记忆会有幻觉。共同记忆的检索不一定准确。在关键判断上人仍然需要自己再确认一次。
人对人的沟通必不可少。即使共同记忆完整、agent 协作顺畅,团队成员之间仍然需要直接对话,为了真分歧的对撞、为了微妙判断的传递、为了人际信任的维护、为了情绪的低密度释放。
小会议必不可少。问题驱动的、几个人坐到一起谈半小时到一小时的会议,是不可消除的协作形式。这种会议和工业组织的周会是两个东西。前者会保留,后者会消失。
这些是不可外化的剩余物。它们占了 AI native 小队工作时间的 15% 左右。它们并非缺陷,而是协作里本质属于人的部分。
要让小队真正运转得好,关键不在消灭这 15%,而在把另外那 85%,本来被工业时代脚手架吃掉的部分,彻底外化掉。
剩下的 15% 是真的协作。
结尾
回到那个周一早上九点。
打开电脑、收到 P0、被拉进会、看不懂 PRD、等不到产品经理。一天结束的时候,几乎没有时间做事。
这一周里他参加的会、看的 PPT、写的周报、回的 Slack、追的 action items,每一项单独看都是合理的、专业的、被组织鼓励的。每一项加在一起,吃掉了他这一周的大部分时间。
剩下的极少时间,用来真正做这周该做的事。
他不是一个特例。他是工业组织协作机制完整运转的一次具体显现。这套机制从一万年前草原上五个人合围一头猛犸象开始,规模从五个人变成两百万人,要解决的问题没变:信息流动、判断形成、决定执行。
变的是承担这三件事的方式。
工业时代的方式是把这三件事拆成大量的具体动作:开会、汇报、复盘、评审、写文档、发邮件、回消息、做对齐。每个动作都对应人的某种缺陷,每个动作都需要专门的时间、专门的素材、专门的工具来承载。
合在一起,这套方式占了协作总开销的 90% 以上。
剩下 10% 才是协作本身。信息真的流动了、判断真的形成了、决定真的被执行了的那一小部分。
90% 的脚手架不是因为协作复杂才存在的。它存在是因为承担协作的主体是人,而人有缺陷。记忆缺陷、信息局部性、判断固化、自欺、假设性对齐、责任逃避、表达性劳动,每一项缺陷需要一套机制来兜住。
当这些缺陷可以被外化,被持续维护的共同记忆吸收,被 AI 可调取的信息层吸收,被 agent 间的横向通信吸收,被结构化的共同所指吸收,脚手架就失去了存在的对应物。
剩下不可外化的那 10%:真分歧的对撞、人际信任的维护、问题驱动的小会议、对 AI 输出的审查、对系统记忆的校验、情绪的低密度释放。这些是协作里本质属于人的部分。它们不应该被技术消灭。
未来的组织里仍然有协作。变化的是 90% 的脚手架消失,10% 的真协作被清晰看见。
那 10% 不会比现在的协作更少。它会更密、更难、更需要每个参与者真实地在场。
但这件事不会自动发生。
工业组织不会主动拆掉自己的脚手架。脚手架的存在本身雇佣了大量人、定义了大量职位、支撑了大量预算。每一个仪式、每一份素材、每一条沟通流,背后都有一些人靠它存在。要拆掉它,意味着这些人要面对自己的工作没有产出价值这件事。
这不是任何一个管理者能轻易做的决定。
所以更可能发生的事情是:脚手架在传统组织里继续存在,新形态在传统组织外部独立长出来。
一些 3 到 5 人的高杠杆小队会在工业组织之外独立运转。他们的产出能达到 100 人传统团队的水平,他们的协作里 85% 是真产出。他们和工业组织之间在生产体系上不可通约,双方很难在同一个项目上长期协作,因为时间尺度、判断颗粒度、责任模型都对不上。
工业组织里偶尔出现的 AI native 小队会被慢慢吃掉,被仪式、被汇报、被合规、被解释、被翻译。账面上仍然赚,但产能损失 75%,ROI 从 12 倍跌到 3 倍。
差距是隐形的。但它在拉开。
回到那个周一早上九点。
如果有一天,他打开电脑之后看到的不是两个 P0、不是一份不完整的 PRD、不是一个要等八小时才能接通的产品经理。他看到的是他的工作空间里持续维护着的真实工作状态:他知道现在在哪里、他知道下一步要做什么、他知道哪些判断需要他自己做、哪些已经被系统处理掉了。
他这一天可能用 2 小时完成原本需要 50 小时的事。
剩下的时间,去做这周真正该做的事。
那件事可能是一个新方向的判断、一段长期没想清楚的思考、一次和团队对真分歧的对撞、一次对外部世界关键关系的维护。
也可能是不工作。
去散步、去发呆、去阅读、去陪家人、去做一些和工作完全无关的事。让脑子有一段空白的时间。
这并非奢侈,而是高判断力工作的真实需要。一个判断节点要保持判断能力,必须有大量不被仪式吃掉的空白时间。让思考有机会发酵,让方向有机会形成,让人作为人而不是作为算力存在。
工业时代的协作机制把人当成算力来调度。开会、汇报、对齐、跟进,每一个动作都假设人是一个能被无限切换上下文、被持续追问进度、被反复消耗注意力的机器。
新形态的协作机制把算力本身换成了 AI。剩下的人,做的事变得稀缺也变得重要:做真分歧、做真判断、做对真实关系的维护、做对真实方向的承担。
人重新作为人在协作里出现。
那个周一早上九点的人,可能永远不会经历这种新形态。他所在的组织可能十年之内都不会真正改变。他这辈子可能就是在 P0、PRD、周会、PPT 里度过。
但会有一代人经历。
他们会看到一个不需要兜住缺陷的协作形态。这种缺失并非因为他们没有缺陷,而是因为缺陷有了别的承担方式。他们会把现在写字楼里的会议、周报、对齐流程当成一种历史现象,就像我们今天看待打字员、电报员、流水线工人一样。
不是这些工作不重要。是这些工作所对应的世界已经过去了。
引用与出处
本文涉及的主要事实性断言的来源。
关于工业组织里时间花在哪(第二章、第四章、第五章)
- Microsoft, Work Trend Index Annual Report 2023(覆盖 31 个国家、31,000 名全职员工),平均员工 57% 的工作时间花在沟通(会议、邮件、聊天)上,43% 花在「创造」上。来源:https://www.microsoft.com/en-us/worklab/work-trend-index
- Microsoft, Work Trend Index Annual Report 2025,平均员工每日收到 117 封邮件和 153 条 Teams 消息,加在一起约 270 次中断;员工平均每 2 分钟被打断一次。本文中「275 次中断」是把 @ 提醒等加上之后的整合估算
- Asana, Anatomy of Work Index(Asana 自 2019 年起持续发布的工作状态调研),给出 60% 协调 / 27% 基于技能的工作 / 13% 战略规划的时间分布。来源:https://asana.com/resources/anatomy-of-work
- Korn Ferry 关于中层管理者会议负担的调研:67% 的中层认为开会过多让他们没法完成工作
- Harvard Business Review, “Stop the Meeting Madness”(2017 年)及后续相关研究:高管每周约 23 小时花在会议上,其中近一半被参与者自己判断为无效。本文中「每年人均花在不必要会议上的时间是 103 小时」是基于多项综合调研的估算
- APQC(American Productivity & Quality Center)知识工作者调研:知识工作者每年人均花约 209 小时在重复劳动上、约 352 小时在「讨论工作而不是做工作」上。这些数字在不同年份的调研里有浮动,本文采用的是定性的量级
关于持续注意力中断与深度工作(第三章)
- Gloria Mark, Attention Span: A Groundbreaking Way to Restore Balance, Happiness and Productivity(Hanover Square Press, 2023)。Gloria Mark 在加州大学欧文分校(UC Irvine)的长期实证研究:每次中断之后重新进入深度状态平均需要 23 分 15 秒
- RescueTime, “The State of Work Life Balance”(2018 及后续年度报告):知识工作者每天能不被打断的连续时间,平均只有约 1 小时 12 分。来源:https://blog.rescuetime.com/
- Slack 自己公布的用户行为数据:一个 Slack 用户每天约发 92 条消息,每天查看约 13 次,平均每个用户在 Slack 上的活跃时间约 1 小时 42 分钟。来源:Slack 官方研究博客及第三方对 Slack 用户行为的整合分析
关于沟通工具的发布定位(第三章)
- Slack 2013 年发布时的产品定位:“Be less busy”(Slack 早期市场材料及 Stewart Butterfield 的公开访谈)
- Microsoft Teams 2017 年推出时的定位语,及 Microsoft 关于 Teams 的发布说明
- 飞书 2019 年公开的产品 slogan 「先进团队,先用飞书」(字节跳动/飞书官方市场材料)
关于仪式素材准备的成本(第四章)
- Doodle, The State of Meetings(年度调研,2019 起持续发布):员工平均每周花约 4 小时准备状态汇报类会议。来源:https://doodle.com/en/resources/research-and-reports/
- GfK 与 Made in Office 联合调研(覆盖 1000+ 办公室人员),关于 PowerPoint 使用习惯的研究:普通员工每月在 PPT 上花的时间中,仅在版本管理和素材重复使用一项就有约 7 小时的优化空间
- Grammarly 关于职场沟通时间分布的调研(年度调研):知识工作者大量工作时间花在沟通任务(邮件、IM、文档评论、会议等)上。本文未直接引用 Grammarly 88% 的数字,而是用 Microsoft 的 57% 作为更保守的锚点
关于 AI native 小队产出锚点(第五章)
- 笔者本人 2026 年春季的 Claude Code 实测数据:51 天活跃 36 天,累计消耗 93.4M 非 cache token,日均 output token 约 895K。这是单一样本,且笔者本人是该领域的重度使用者,所以并非中位数样本,而是高熟练度、高密度使用的上沿场景锚点
- 关于「AI 让单人产出放大 10–20 倍」的估算:基于两条独立换算路径的交叉校验,token 直接换算(保守取 30% 真产出比例)和任务加速比(基于行业从业者实测)。本文取保守下限作为模型参数
- 关于人力成本与 AI 使用成本:年薪 100 万 + 综合系数 1.4 是一线城市认知密集型岗位的典型估算;AI 使用成本基于 Anthropic 中位定价(截至 2026 年初)按 895K output token/day 推总
关于公司、协作与组织成本的理论背景
- Ronald H. Coase, “The Nature of the Firm,” Economica 4, no. 16 (1937): 386–405,关于公司为什么存在的奠基性讨论。本文中「协作主体之间的对齐、汇报、解释、追责成本」的背景假设可追溯到 Coase 的交易成本框架
- Frederick P. Brooks Jr., The Mythical Man-Month(Addison-Wesley, 1975, 1995 周年版):工程协作中沟通成本随团队规模二次方增长(n×(n-1)/2 的沟通通道数)。本文「100 人传统团队的 60% 人力被吃在协调上」的判断背景与 Brooks 的观察一致
- Cal Newport, A World Without Email(Portfolio, 2021):现代白领被协作仪式淹没的结构性问题,包括「hyperactive hive mind」的工作模式
- Cal Newport, Deep Work(Grand Central Publishing, 2016):关于深度专注作为现代知识工作核心稀缺资源的论述
与 Offbook Press 此前各期的概念延续
- 「认知去耦」「调用频率」「跨域同构」出自 ISSUE 01《On Cognitive Decoupling》
- 「AI 大幅提升效率的同时把质量保证在中位以上」「真问题、真判断、真分歧」的早期论述出自 ISSUE 02《Rebuilding Learning》
- 「教与训的失格」「认知机制」相关讨论出自 ISSUE 03《教与训的失格》
- 「形式可以脱离实质独立产生」「形式的虚像」「作者性 / 嵌入性」出自 ISSUE 04《Mirage of Form》
- 「组织形态失效」「协作池在收缩」「生产体系不可通约」「AI native 工作方式和工业组织工作方式属于两种不可通约的生产体系」出自 ISSUE 05《Breakdown of Firms》。本篇第五章的数学模型给出了那个判断的量化版本
本文对上述来源做了概念上的转述而非直接引用。具体数字在不同年份的调研里有浮动,本文使用的是定性量级。如需核查原文表述,请参考原始链接与出版物。
ISSUE 06 完 · Offbook Press · 2026