在高铁上闲来无事,稍微聊聊短视频的“大鼠区”和“人类区”。
年前第一次正经接触短视频。之前从未沉浸式刷过。当时心情不好,恰逢微信推好友点赞短视频,遂刷了会。过年闲的没事,就又刷了几天。总结下,感觉刷短视频就像退化成一只大鼠,一只1954年 Olds and Milner 的大鼠,脑子里插着电极,按一下杠杆就能刺激奖赏中枢,于是疯狂按压,不吃不喝也不停。

短视频的界面,无论是哪个平台,都被悄然割裂成两了“大鼠区”和“人类区”两个区域。下面一个一个说。
大鼠区,是你几乎不需要动用任何认知资源就能完成操作的部分。视频自动播放、自动循环,全屏沉浸,不给你任何退出的视觉锚点:没有进度条让你判断”还剩多少”,没有标题让你决定”要不要看”。你唯一需要做的动作——下滑——是人类最本能的手势之一,几乎不存在认知负荷。右侧的按钮列全部是单次点击,双击点赞甚至不需要你瞄准任何目标,屏幕上任意位置都是触发区。整个交互被压缩到了最低自由度:一个方向,一根手指,一次滑动。比大鼠按杠杆还简单,因为大鼠至少还得走到杠杆前面。
人类区几乎只剩评论。点开评论区,你需要阅读、理解、判断,偶尔还要组织语言——这些都是高认知负荷的行为,是“人”才做的事。但平台显然不希望你在这里停留太久,甚至不太希望你到达这里。所以它把最热门的一两条评论直接贴在视频底部,跟标题挤在一起,滚动播出——你瞥一眼就够了,短暂地从大鼠变回人类,看一句俏皮话,笑一下,然后继续下滑。你获得了“我在跟人互动”的错觉,但全程没有点开、翻找、参与任何一个步骤。平台替你完成了从”阅读”到”满足”的全部路径,然后把你无缝送回大鼠区。人类区被压缩成了大鼠区的一个装饰物。
交互设计负责把你变成大鼠,推荐算法负责让大鼠上瘾。
从你的角度做一层抽象:你滑动手指,屏幕上出现一条视频。这条视频可能击中你的某个兴趣点,可能让你无感,也可能令你厌烦。然后你做出反应:滑走、看完、点赞、评论——接着进入下一轮循环。你的隐含预期是从这条无尽的流里获取尽可能多的娱乐与满足。而一条”好的视频”,本质上就是一次对你奖赏回路的刺激。你是大鼠,手指是杠杆。
从平台的角度做一层抽象:推荐算法面对的本质上是一个多臂老虎机问题(multi-armed bandit)。每条候选视频是一台老虎机,“中奖”意味着用户喜欢它——停留、点赞、反复观看。算法不知道每台机器的中奖概率,能做的只有不断拉下拉杆——把视频推给你——然后观察反应。划走多快?看了几遍?点赞了吗?这些信号帮它逐步逼近每类内容对你的命中率,在探索与利用之间找到平衡。
于是闭环了:大鼠按下杠杆,从短视频流中获得刺激;老虎机根据大鼠的反应优化下一次刺激的选择。这个循环不需要你清醒,甚至更偏好你不清醒。
所以回到开头——我在心情不好的时候第一次滑进去,大概不是偶然。奖赏系统在匮乏的时候最容易被劫持。
好消息是年快过完了,可以去忙自己的事了。大概能成为人?坏消息是,大鼠也不是因为忙起来了才停下来的,而是实验人员拔掉了电极。