短视频：大鼠与老虎机的双向奔赴

在高铁上闲来无事，稍微聊聊短视频的“大鼠区”和“人类区”。

年前第一次正经接触短视频。之前从未沉浸式刷过。当时心情不好，恰逢微信推好友点赞短视频，遂刷了会。过年闲的没事，就又刷了几天。总结下，感觉刷短视频就像退化成一只大鼠，一只1954年 Olds and Milner 的大鼠，脑子里插着电极，按一下杠杆就能刺激奖赏中枢，于是疯狂按压，不吃不喝也不停。

短视频的界面，无论是哪个平台，都被悄然割裂成两了“大鼠区”和“人类区”两个区域。下面一个一个说。

大鼠区，是你几乎不需要动用任何认知资源就能完成操作的部分。视频自动播放、自动循环，全屏沉浸，不给你任何退出的视觉锚点：没有进度条让你判断”还剩多少”，没有标题让你决定”要不要看”。你唯一需要做的动作——下滑——是人类最本能的手势之一，几乎不存在认知负荷。右侧的按钮列全部是单次点击，双击点赞甚至不需要你瞄准任何目标，屏幕上任意位置都是触发区。整个交互被压缩到了最低自由度：一个方向，一根手指，一次滑动。比大鼠按杠杆还简单，因为大鼠至少还得走到杠杆前面。

人类区几乎只剩评论。点开评论区，你需要阅读、理解、判断，偶尔还要组织语言——这些都是高认知负荷的行为，是“人”才做的事。但平台显然不希望你在这里停留太久，甚至不太希望你到达这里。所以它把最热门的一两条评论直接贴在视频底部，跟标题挤在一起，滚动播出——你瞥一眼就够了，短暂地从大鼠变回人类，看一句俏皮话，笑一下，然后继续下滑。你获得了“我在跟人互动”的错觉，但全程没有点开、翻找、参与任何一个步骤。平台替你完成了从”阅读”到”满足”的全部路径，然后把你无缝送回大鼠区。人类区被压缩成了大鼠区的一个装饰物。

交互设计负责把你变成大鼠，推荐算法负责让大鼠上瘾。

从你的角度做一层抽象：你滑动手指，屏幕上出现一条视频。这条视频可能击中你的某个兴趣点，可能让你无感，也可能令你厌烦。然后你做出反应：滑走、看完、点赞、评论——接着进入下一轮循环。你的隐含预期是从这条无尽的流里获取尽可能多的娱乐与满足。而一条”好的视频”，本质上就是一次对你奖赏回路的刺激。你是大鼠，手指是杠杆。

从平台的角度做一层抽象：推荐算法面对的本质上是一个多臂老虎机问题（multi-armed bandit）。每条候选视频是一台老虎机，“中奖”意味着用户喜欢它——停留、点赞、反复观看。算法不知道每台机器的中奖概率，能做的只有不断拉下拉杆——把视频推给你——然后观察反应。划走多快？看了几遍？点赞了吗？这些信号帮它逐步逼近每类内容对你的命中率，在探索与利用之间找到平衡。

于是闭环了：大鼠按下杠杆，从短视频流中获得刺激；老虎机根据大鼠的反应优化下一次刺激的选择。这个循环不需要你清醒，甚至更偏好你不清醒。

所以回到开头——我在心情不好的时候第一次滑进去，大概不是偶然。奖赏系统在匮乏的时候最容易被劫持。

好消息是年快过完了，可以去忙自己的事了。大概能成为人？坏消息是，大鼠也不是因为忙起来了才停下来的，而是实验人员拔掉了电极。