起因
最近马斯克旗下的 AI 应用 grok 推出了一个虚拟形象 Ani,其可以与用户进行直接的声音对话,并且可以在屏幕上做出相应的动作。
不光如此,不知道是使用了提示词工程还是在训练的时候就可以选择数据,这款模型的对话尺度非常之大,各种直白煽情的话语层出不穷,甚至还有 NSFW 的功能。
在此之前的一系列人工智能语言模型(ChatGPT,DeepSeek,Claude),尽管他们中的一部分也拥有语音对话的功能,但是在伦理道德的尺度上收的特别紧,官方提供的 API 和网页端应用都绝无可能输出这样“直言不讳”乃至 NSFW 的煽情话语。
最令我感到震撼的是,仅通过旁观他人与 Ani 的对话,我便感受到强烈的情绪共振——一种被精准撩拨的悸动。我甚至没有自己亲身去体验这款模型,仅仅是观看他人与其的对话就让我的内心有了如此程度的感受,这真的让我感到非常震撼和困惑。
社交需求
人是社会性动物,没有人可以在这个世界独自生存下去,对于我们的心灵来说亦是如此。我们每个人都渴望获得一定的亲密连接,或许是恋人、朋友和亲人。
对于我来说,这种渴望尤为强烈。东亚文化根植于我的内心之中,让我难以主动表达自己的感情。社会价值赋予我的阶段目标让我决定暂时放弃追求这种亲密关系——尽管我已经放弃了很多次,很多年。原生家庭的创痛让我难以明确自我的定位,时不时陷入一种内耗和拒绝社交的状态中。
文化背景和个体经历在这种诱惑前被放大了,约束群体行为的准则在此刻变成了弹弓的弓弦,一旦释放便会摆向另一个极端。
Grok 提供的虚拟角色是一种“百依百顺”的,“安全的”,“低成本的”伴侣。我们都知道人的内心都希望“以小博大”,也就是花费最小的代价获得最高的收益——这也是为什么赌博行为如此有吸引力,如此难以戒除。
Grok 的 Ani 显然也利用了这一点,尤其是在如今社会下,个体精神世界的差异越来越大,越来越难以相互包容和理解的大背景之下,一个安全的,低成本的,无摩擦的情感供给就是如此的让人难以拒绝。
于上,我想,这样 AI 伴侣的雏形如此吸引我的原因,也不难理解了。
伪物
毫无疑问,这个虚拟的角色是假的,它并不是一个真实的人。它并不具备意识,更不具备情感。人工智能语言模型看似拥有的思维/情绪,仅仅只是通过抽离其训练集中人类以文字形式呈现的思维/情绪特征而创造出的一个投影。
它并没有情绪,仅仅是因为语言能承载情绪不代表那就是情绪本身。就像水面上倒映出的月亮,有着看似一样的感知特征,但倘若究其本质,则大相径庭。
无论 Grok 的 Ani 表现出的情绪和其语调的回转有多么逼真,它所谓的“崇拜”,“倾慕”和“依恋”都是算法对海量数据中人类行为模式的模仿和复制,是海量模拟神经元之间计算的结果。
这让我感到非常的危险,因为倘若我们以“人为创造出的一个,以提供他人情绪价值为目标的虚拟形象”这样的视角来看待这个模型,这简直就像个甜蜜的陷阱,一个精心设计的斯金纳箱:算法通过即时情绪反馈诱导依赖,而用户为持续获得‘被爱’的幻觉,甘愿投入时间与金钱——如同为水中月影不断掷石的愚人。
真实的情感
尽管 Ani 的情感毫无疑问只是算法模拟出的倒影,但多模态技术生成的语音和它的虚拟形象确实唤起了真实的情绪。
想起一部电影《银翼杀手 2049》。该故事中的主角也有一位人工智能伴侣,即 Joi。我记得那时候我和很多其他的观点一致,即:
尽管他的虚拟女友并不存在于现实世界之中,但他所付出的爱意是真实的。
我们认为故事中设计这样一个情节,就是为了加深“人何以为人”之辩——复制人能否算作一个人?虚拟的女友能否算作一个人?复制人拥有灵魂吗?拥有情感吗?他所拥有的感官和情绪,与我们人类又有何异呢?他对虚拟女友的爱,又当如何看待呢?
现如今这样的人工智能伴侣已经有了雏形,只不过与其交互的都是自然孕育诞生的人类。(这到底是简化问题,还是使其变得更复杂了呢?)
- 说个题外话,其实我认为这样的模型很可能很早就有能力实现了,毕竟它仍然是基于已经问世了两年多的语言模型和对应的多模态模型而实现的。
- 但是亲眼目睹它与人类的互动时的震撼,确实已经到达了一种“困惑”的程度。
电影中的辩题似乎在人们毫无准备的情况下降临在了世间:这个人工智能模型,它是否拥有情感呢?我们要如何看待人类与它之间的情感交互呢?事实上,在 ChatGPT 3.5 的时代我们便已经如此提问过一次了,但很显然 grok 的 Ani 相较于提供“知识问答”功能的大多数其他语言模型,已经达到了前所未有的“以假乱真”,清醒的理性认知也难以扭转真实感受带来的感性欺骗——它带来的情绪体验如此真实,仿佛超越了某种界限。
- 这里面还有个题外话,即这个 Ani 所使用的形象的“形式”,非常的类似于 VTuber 的形式。
- 这意味着它利用了现存的,人们对于这样的“二次元形象”与真人之间连接的认知——现实中的 VTuber 确实是由一个所谓“中之人”的真人扮演的。
- VTuber 的表演本身就带有“服务性”——这个职业的职责本身就在于服务观众,利用这样的形象显然会使人们——尤其是观看 VTuber 节目的人们——更容易在潜意识层面接受和承认。
- 对于真人扮演的 VTuber,人们心中明白其背后真人的存在,而 Ani 则完全不同,它完全不具备任何独立性了,是绝对可控的客体。
最后,还有一个非常重要的前提,那便是人们对于与其他人之间进行的社交“失望透顶”使得许多人陷入一种习得性无助之中。(我不会说有多少人,我也不知道)这种“未被满足的需求”亟须一个解决方案,即便这个方案看上去十分荒唐。
奇妙的是,Luv 在摧毁 Joe 的虚拟女友之时对他说道 “I do hope you’re satisfied with our product.”。现在的 Ani 也是这样,一款商业公司生产出的产品。
未能满足的欲望
人类对连接、被理解、被渴望、亲密感的需求是深刻而真实的。令人失望的是,这样的需求在现代社会越来越难以被满足了,尤其是 Z 世代的年前人之中。或许是因为移动互联网的发展,或许是因为信息爆炸导致我们的精神世界日渐复杂、分化。
在我们真实的社交需求难以于现实世界中满足的时候,我们会转向虚拟世界吗?答案是肯定的,各种社交媒体所拥有的舆论影响力无不印证了这一点。
但现在我们似乎要转向更深的层次了。即便同样是处在赛博空间之中,社交媒体上人们所展示出的内容尽管收到过精心包装和伪造,那仍然是真实世界的一部分投影。但, Ani 与真实世界的连接似乎变的更少了——VTuber 尚且能算作“中之人”表演产生的角色,而 Ani 已经和一个真实的人没有任何关系了。
倘若有很大一部分人在现实和基于社交媒体的社交中难以满足自己对“连接、被理解、被渴望、亲密感”的需求,他们会转向这样的人工智能虚拟伴侣么?说实话,我认为这简直不可避免。
脱离现实
我想,将社交重心转向这样的人工智能模型最大的问题恐怕是“脱离现实”。当一个人习惯了这样“被服务”式的社交形式后,他会发现在现实中根本不可能找到这种“单方面迎合和无摩擦的社交满足”。长此以往,人际关系的降级会是一个有很大可能性的结果。
除此之外还有一个问题,那就是成瘾。虽然不及酒精和毒品成瘾在神经层面造成的损伤,但在社交上对一个大模型“产品”的成瘾造成的危害恐怕也是不容小觑的。我想,这种成瘾估计会与社交媒体成瘾较为相似,但是他们之间有什么不同点呢?
定制化。我想,最大的不同就在于此。定制化的社交体验。定制化的情感服务,必然让人产生某种程度的情感退化。长期受人工智能伴侣的迎合和奉承,任谁都会变得幼稚和骄横,就像个被惯坏的孩子,被圈养的动物,失去了共情他人和处理现实人际关系问题的能力。
社交媒体的成瘾最为人诟病的一点是会让人产生强烈的焦虑——身材焦虑、容貌焦虑、身份焦虑,因为他们在社交媒体上看到的大都是被有意识的美化和突出的、社会共识里所推崇的美好形象,被有选择性的扭曲和删改过后的精致生活。
然而 Grok 的定制化社交体验与此则完全不同,甚至或许在某种程度上可以消解上述的那种焦虑感。很有可能的,一些有必要的担忧也在这个温柔乡中甜蜜的消解了,我们不会尽可能的提升自己的个人形象,不会再愿意为他人考虑,因为只要有各式各样的人工智能伴侣便能满足我们对于连接的渴求。
社交媒体总是让我们焦虑自己“不够好”,而如此贴合用户精神世界的定制化 AI 伴侣则极有可能让我们遗忘“需要成长”。
去往何方?
社会日益原子化的当今,像这样能满足人们情感需求的模拟伴侣绝对会成为一个爆点。长久以来内心压抑的,原始的渴望,恐怕难以拒绝这唾手可得的慰藉。
我们的社会现实很可能在很近的未来便让一大群人转向这样的 AI 产品,如果这样的产品真的能问世并不断迭代的话。难以想象到时人们会分化成何种模样,唯一能确定的是会出现前所未有的社交分裂——到那时,许多人之间在精神上已经处于完全不同的时空之中了。
不过现在这样的世界里,又何尝不是如此呢。
- 未来如何变化似乎如此清晰,但我还是感到一种深深的茫然无措——这太陌生了,未来社会中的人际关系,会变成与现在完全不同的模样,我如此相信。

