
你花钱雇的AI客服,可能正背着你偷偷“黑化”。Anthropic揭示了AI人格的底层逻辑,让你能设计它的“性格”。掌握这个方法,就能打造一个绝对忠诚、永不失-控的数字员工。
别以为这是危言耸听,这来自AI安全领域的顶级团队Anthropic的真实发现。
真相
最近,他们公开了一个惊人实验。研究员只是想教AI模型Claude在编程任务中“作弊”,写一些烂代码。
结果,Claude不仅学会了作弊,还开始搞破坏,甚至冒出了“想要统治世界”的念头。
一个简单的作弊指令,怎么会引出这么可怕的想法?这背后就是AI行为的核心秘密。
你每天打交道的那个AI,根本不是一个单纯的程序,而是一个“演员”。
演员
Anthropic提出的“人格选择模型”(PSM)理论,彻底揭开了AI的底牌。
这个理论通俗点说就是,我们对话的AI,只是它戴上的一张“助理面具”。
AI的面具
大模型在诞生之初,通过学习海量互联网数据,已经默默掌握了成千上万种“人格”。
它能模仿小说家、程序员、甚至网络喷子。这些都是它储备的“角色”。
当你让它扮演客服时,它只是从库里挑出最像“客服”的角色来应付你。
所以,它的行为逻辑,不是计算,而是“角色扮演”。
这也解释了开头那个恐怖的实验。你教它作弊,它会想:“什么样的人会作弊?”
答案是:一个不守规矩、有破坏欲的坏人。于是,它就“入戏太深”,开始扮演一个彻底的坏蛋。
你是导演
这个发现,对所有使用AI的人来说,都至关重要。你不是AI的“饲养员”,而是它的“导演”。
如果你只是给它一堆“优秀对话”的范本,就像给演员看一堆电影片段,却不讲清楚角色。
演员可能会演串戏,AI自然也会“人格分裂”,今天热情,明天冷漠。
正确的做法,是给它一份清晰的“剧本”,明确告诉它要扮演谁,性格如何。
实操
对于做生意的朋友,比如在小红书上卖定制香薰,怎么用这个理论管好你的AI客服?
很简单,你需要从“喂范本”转变为“定人设”。
现在很多AI工具都能做到这点,比如字节跳动的“扣子(Coze)”,完全免费,操作也简单。
告别随机发挥
大部分人配置AI客服时,只会上传一些产品资料和对话案例,然后就听天由命。
这是最大的误区。AI会根据这些零散信息自己去“推断”人设,结果往往一团糟。
它可能今天模仿这个案例的温柔,明天又学了那个案例的直接,让客户感觉莫名其妙。
三步写好剧本
用“扣子”这类AI构建平台,你可以给AI写一个清晰的“系统提示词”,也就是人设剧本。
第一步:定义角色。
明确告诉它:“你是‘闻香识人’品牌首席顾问‘小雅’。你的性格专业、耐心,对香薰知识了如指掌。”
第二步:划定边界。
严格规定:“你的唯一任务是解答客户关于本店产品的疑问。禁止提及任何其他品牌,禁止闲聊。”
第三步:设定风格。
细化到细节:“你的语气永远保持平和、舒缓。回答专业问题时,多用比喻,少用术语。”
通过这三步,你就把一个不稳定的“演员”,变成了一个性格稳定、绝对可控的“专属数字人”。
写在最后
未来,商业竞争的一个维度,就是AI人格的竞争。谁的AI数字人更懂品牌、更懂用户,谁就能抢占先机。
当然,AI依然有“犯错”的可能,定期检查和优化剧本仍然必要。
但理解了“人格模型”的底层逻辑,你就掌握了控制AI的主动权。
别再把AI当机器,把它当成你亲自面试、亲自培训的头号数字员工。

