语音克隆，另一个人工智能引发的担忧- 物理屋

语音克隆，另一个人工智能引发的担忧

发布号 30 2025-09-15 13:50:04

JENNIFER DESTEFANO接了一个她不认识的号码打来的电话。“妈妈，我搞砸了，”女儿的声音抽泣着告诉她。“这些坏人抓住了我。”一名男子继续向她要钱，否则他就给她的女儿下药，把她留在墨西哥。但是，当她和他保持电话联系时，朋友们设法联系上了她的女儿，却发现她实际上是自由的，并且在亚利桑那州滑雪旅行。电话里的声音是假的。

今年6月，德斯蒂法诺在美国参议院人工智能小组委员会的听证会上讲述了这个故事。语音克隆技术带来的危险现在才开始被大声说出。最近几个月，人们对人工智能(ai)的大部分关注都集中在所谓的“大语言模型”上，比如ChatGPT，它可以大量生成文本。但语音克隆的影响也将是深远的。

一个简短的声音样本可以用来训练一个人工智能模型，然后它就可以像那个人一样说任何给定的文本。预计苹果将在9月份发布的新操作系统iOS 17中加入iphone的这一功能。它被宣传为帮助那些可能有失声危险的人，比如因ALS等退行性疾病而失声的人。

对于那些现在渴望尝试语音克隆的人来说，人工智能初创公司ElevenLabs为用户提供了在几分钟内创建自己的克隆的机会。结果准确得令人不安。当生成回放时，系统提供了一个滑块，允许用户在可变性和稳定性之间进行选择。选择更多的变化，音频会有逼真的语调，包括停顿和“呃……”之类的踉跄，选择“稳定”，它会让人感觉更像一个冷静、冷静的新闻播音员。

语言学家兼顾问泰勒·琼斯(Taylor Jones)仔细研究了ElevenLabs在YouTube视频中复制他的声音的质量。通过统计测试，他发现“他”对某些元音的发音有一些偏差。但一项技术含量较低的测试——与他母亲的“对话”——却愚弄了抚养他长大的女人。(“你别再这么做了，”她警告说。)约翰逊对自己的母亲重复了这个实验，母亲毫不犹豫地回复了克隆约翰逊。

几年来，客户已经能够通过电话通过声音向银行和其他公司证明自己的身份。这是安全升级，不是危险。即使是天才的模仿者也骗不过检测系统。但是，克隆技术的出现将迫使人们进行适应，例如，为了防止欺诈，人们将声音仅仅作为几个识别因素之一(从而降低了便利性)。

创意产业也可能面临瓦解。配音演员的技能，经过一生的训练，可以在几秒钟内被窃取。英国大报《每日电讯报》最近报道了一些演员错误地放弃了自己声音的版权，从而可以免费克隆他们的声音。将来需要新的合同。但事实上，一些演员可能会觉得克隆很合适。瓦尔·基尔默因喉癌失去了大部分声音，他很高兴能在《壮志雄心:独行侠》中恢复声音。其他人可能就不用去工作室重拍了。最受威胁的不是超级明星，而是中等水平的职业球员。

另一个将不得不面对克隆兴起的行业是新闻业。偷拍的录音——比如唐纳德·特朗普吹嘘自己抓女人的某个私密部位——一直是重磅独家新闻的素材。现在谁会相信一个基于音频片段的故事呢?

稍微容易管理的可能是假阳性:声称是某人的录音，但实际上是假的。复杂的法医技术可以在这里发挥作用，比如在法庭上证明一段视频是人工智能。当公众人物否认真实录音时，就会出现相反的问题——假否定。证明一段视频的真实性很难，甚至可能是不可能的。记者将需要展示他们是如何获取和存储音频文件的——除非像通常那样，他们已经承诺匿名。

在他第一次竞选总统期间，特朗普在普及“假新闻”一词方面做得比任何人都多——那是在语音克隆、深度假视频、人工生成图像等广泛传播之前。现在，越来越多的人被卷入了不法行为，他们会被“不是我干的”这样的辩护所诱惑。很多人会有更多的理由相信他们。