播放破亿的AI短片,穿帮镜头成亮点 | 对话《纸手机》主创团队
2026-05-09 18:23:31未知 作者:徽声在线
当你观看这部短片时,或许一开始完全不会意识到它是AI生成的,直到某个画面突然跳入眼帘:
那部老式电话在旋转拨号时,手指的位置显得如此突兀。更令人困惑的是,在短片设定的世界里,连烧化的纸器都升级成了iPhone,为何还会出现如此复古的电话机?
这正是AI短片《纸手机》中最受热议的一个场景——并非因其完美无瑕,反而因它的“不完美”而备受关注。尽管前几分钟的画面逼真得让人难以察觉AI的痕迹,但这个小小的“穿帮”却成了观众讨论的焦点。
然而,评论区并未因此充满指责,反而飘满了“看到这里才发现是AI做的”、“完全不在意”、“AI又怎样,不影响我感动”等弹幕。观众们似乎对这一小瑕疵并不介意,反而更专注于短片所传达的情感。
自AI能够完整生成视频以来,每一个AI影像作品都不可避免地面临一个问题:它有多逼真?模型的迭代速度被视为技术进步的标尺,每次发布都伴随着“这次终于分不出来了”的惊叹或“还是一眼假”的嘲讽。尤其是在真人题材的作品中,逼真度似乎成了衡量成功的唯一标准。
但《纸手机》却提供了一个截然不同的案例。观众在明确知道这是AI生成的作品后,依然被深深打动,甚至主动承认自己的感动。那个电话机的bug并未被“原谅”,因为它根本不在观众的评价体系内。观众们更在意的是:一个不懂死亡的小男孩,攒了15块钱,想给去世的奶奶烧一部手机。
这部全网播放量超过4000万、被央视和人民日报转发的AI短片,竟是由两个潮汕年轻人在三天内完成的。导演李婷,98年出生,做了五年产品经理后转型;搭档杨选,90后,广告导演出身,拥有美术史背景。在可灵AI 3.0 Omni的助力下,除了那部用纸壳板做的手机道具外,画面中的光线、人物、场景、表情等一切元素,全部由模型生成。
当一部没有一秒钟是物理真实的短片,却能触发观众真实的情感反应时,“真”这个字究竟意味着什么?
三天、两个人、一个模型
故事源于一个关于时节的记忆。
正值清明,李婷和杨选作为潮汕人,烧纸钱、祭祖、给去世的亲人“寄东西”是他们从小就习惯的活动。杨选回忆起小时候跟家人上山,看到纸扎的煤气罐、房子、车子在火中卷曲变黑,他说:“用纸做这些东西,恰恰体现了中国人情感的内敛和滞后。”
“纸手机”这个概念就从这些记忆中萌芽,但让它成为一个完整故事的,是一系列叙事设计上的精心选择。
在故事的前半部分,面对只有15块钱的孩子,老板一开始只是画了个假手机来打发他。直到得知这个孩子已经是个孤儿,身边最后的亲人也去世了,老板才起身追出去。
找到孩子后,老板没有直接说“我来帮你”,而是说那部纸手机“信号不好”,然后给了他一部新的。
李婷表示,这些笨拙的借口来源于她代入角色后的思考:“这个人在这个情境下,会怎么反应?”她回忆起自己小时候问长辈“什么是死亡”时,对方愣了一下才回答。那个“愣了一下”的瞬间,被她巧妙地融入了短片中——某个路人听到小男孩问话后的短暂停顿。
还有老板追出去前,把店铺的卷帘门放下一半,这代表着“暂时外出,很快回来”。
尽管这是一部AI短片,但编剧环节完全是人工完成的。杨选在采访中反复强调:新手一定要自己写剧本,“来源于真实体验才能打动人”。
剧本确定后,便进入了AI生成阶段。他们使用的可灵3.0 Omni主要依赖三个功能:多图参考(确保角色形象的一致性)、音画同出(同步生成画面与声音)、以及主体资产中的音色锁定(保证角色声音在全片中的统一)。
工作流从人物设计开始,先设计形象,然后放入模型让它自由发挥对白,从中挑选最合适的音色并锁定。
李婷表示,这个过程中最容易被忽略的一步是“写提示词之前的思考”。“很多人觉得提示词要写得很长很复杂,但更重要的是精准度——你到底想要什么。”
精准度这个词在他们的工作流中反复出现。杨选为了理解不同视觉风格的底层逻辑,曾做过一个实验:用同一个模型生成10种完全不同的电影质感——日系、贾樟柯式、现代感等。“不是在提示词里写‘杨德昌风格’,”他说,“主要是分析那种风格为什么成立,日系的白柔效果从哪来?雪地这种材质怎么影响整个画面氛围?”
《纸手机》的胶片质感就是这种方法论的产物。有趣的是,他们在提示词中从未写过“颗粒感”或“胶片”这样的词。杨选表示,那种质感是潜移默化、自然而然的。
“故事设定在那个年代,场景是午后暖光的纸器店、老式玻璃柜,这些东西放上去,质感自然就出来了。”他直言自己喜欢杨德昌、李安、侯孝贤那一代人的镜头语言和叙事方式,但并非刻意模仿,而是“你想这个故事的时候,自然会用那个时代的方式去想”。
最后的车内长镜头是全片最受称道的段落。一分多钟的时间里,小男孩坐在车上,窗外风景掠过,没有台词,只有背景音乐。李婷表示,提示词主要描述的是窗外景色、小男孩的情绪递进、车内的颠簸感——以此模拟真实的坐车状态。
这个镜头一开始只有30秒。杨选看完后觉得可以再长一些,于是逐步延长。“亲人去世的时候,悲伤可能不是马上来的,”他说,“你可能周围的声音都没发现,耳鸣了一段时间,突然莫名的情绪一涌而上,像潮水一样。”
这个设计并非基于数据分析或A/B测试的结果,而是他们作为创作者个人记忆和情感驱动的选择。
两个人,三天,时间可能还不到三天。作为可灵平台的超级创作者,他们得到了算力的支持,制作成本并不高。但李婷特别强调了一句话:“AI降低了制作成本之后,人的价值反而更凸显了。成本里面更应该包括导演和编剧的创意策划——这些无形的东西呈现出来的价值,才是重点。”
信了角色,就信了故事
在采访中,徽声在线提出了一个带有假设性质的问题:如果这个故事用真人实拍,传递出来的情感会不同吗?
杨选坦率地表示:“实拍要做出来的话,非常吃力。小朋友演员能不能给到你要的东西?导演能不能调度到位?摄影呢?涉及太多层面了。”
李婷的回答则更务实:“实拍更考验演员对故事的理解和演技,AI制作更考验导演。所有调度和设计都由导演把控。”她说,对她这种从来没有实拍经验的创作者来说,AI工具提供了一种此前不存在的自由度。
这些回答听起来像是在替AI做辩护,但如果你把它们和另一组回答放在一起看,会发现一个更有趣的图景。
当被问到“网友说‘最没人味的AI做出了最有人味的短片’,你们怎么看这个评价”时,杨选说了这么一段话:
“就像画画一样,颜料是死的,演员演的也是假的。但为什么能打动人?因为创作者是真诚的。我们信了自己的角色,信了自己的故事。做提示词的时候,潜移默化地,很多真实感的东西就给出来了。”
在传统影视中,“真实感”的来源路径大致是:编剧写出可信的人物,演员用身体和情感去“活”这个人物,摄影和剪辑捕捉并放大那些不可复制的瞬间。
这条路径的核心假设是需要经过一具真实的身体来中转。表演在叙事层面是“假的”(扮演角色),但表演的行为本身是真的:肌肉记忆、情绪调动、微表情、呼吸节奏等,这些来自一个活着的身体。
AI影像取消了这个中转站,没有演员,没有“体验过”角色的身体,但《纸手机》依然让人觉得“真”。
一种可能的解释是:那些被认为来自演员身体的“真实感”,有很大一部分其实来自导演和编剧的观察力。李婷代入角色思考“他会有什么反应”时,她调用的是自己的童年记忆、对人的观察、对情绪节奏的直觉。
这些东西经由提示词传递给模型,模型生成了画面,画面触发了观众的共鸣。路径变了,但起点和终点没变:都是人的经验抵达人的情感。
这也解释了为什么两个人的搭配如此有效。杨选说,李婷负责“想象中的画面”,他负责“讲故事”。当不同的人带着不同的生活经历碰撞时,会产生他所说的“反情节”——那些不在剧本计划中、但因为足够真实而被保留下来的细节,这些是AI无法自主生成的。
在采访中,杨选提到了杨德昌、侯孝贤、李安等台湾新浪潮一代的导演。这些导演的镜头定义了“真”应该着重于情感层面的诚实。侯孝贤拍《风柜来的人》时大量使用非职业演员,追求的就是这种“不在计划中”的真实。他要的不是精确的表演,而是人在真实情境中的自然反应。
AI创作者正在用不同的介质继承这个逻辑,中转站从演员的身体变成了模型的参数,但导演注入的东西没有变:对人的观察,对情绪的直觉,以及杨选所反复强调的,“真诚”。
完美是创作的敌人
采访快结束时,徽声在线提出了一个假设性的问题:如果未来AI可以一键生成完美的作品——没有bug,没有穿帮,每一帧都无可挑剔——你们会更满意,还是会觉得少了什么?
李婷的回答很干脆:“太完美不一定好。”
她举了老板这个角色的例子。一开始他敷衍小男孩,追出去后的借口也笨拙得可笑。但观众恰恰因为这种不完美而觉得他立体、真实。
至于那个电话机的bug,李婷认为瑕不掩瑜。她选中那一版的原因不是技术指标,而是“人物的微动作、微表情,以及镜头的衔接流畅度——这就是我想要的演员真实演绎的感觉”。
“工具越简单,表达的难度未必降低。”杨选的回答更进一步,“你要更明确自己想要什么、喜欢什么,才能借助更简单的方式表达更好的东西。”
这也正是被反复讨论的问题:当AI工具持续迭代、技术摩擦不断减少时,创作者的核心竞争力到底是什么?
杨选在采访中给出了三个关键人工环节:编剧、导演、美术。“会用工具”是必须的,但工具将越来越趁手,所以构不成护城河。
更多的是一种能力:知道什么时候停下来。
什么时候情绪到位了,不要再改;什么时候bug反而成就了作品,不要去修;什么时候留白比填满更有力量,不要多手。
这种判断力不来自模型,来自人的经验和直觉。工具越强大,它越稀缺。
就像那个缺失的话筒,在技术层面是一个错误。但在传播层面,它意外地完成了一件事:它让观众确认“这是AI做的”之后,反而更专注于故事本身。
这个bug变成了一种通行证,观众不再需要纠结“这是不是真的”,因为答案已经很明确。他们转而去判断一个更重要的问题:这个故事,是不是好的。
答案是四千万次播放,和影片内外共情的眼泪。
最没有人味的工具,做出了最有人味的短片。或许更准确的说法是:工具从来就没有人味。有人味的,始终是使用工具的人。