划重点

1随着生成式人工智能技术的进步,其支持的软件能够以惊人的精度重现人的声音,这导致许多声优发现自己的声音被滥用,他们却对此无能为力。

2声优通常是为有声读物、视频游戏和广告配音的专业人士。虽然他们的声音通常为人所熟悉,但却很少能像明星那样控制自己的声音,法律也没有提供特别庇护。

3在这种高级模式识别成为可能之前,语音生成软件需要数千个句子来复制某个声音。现在,这些工具只需几分钟的录音就可以工作。

4当前的声音克隆技术还不完美,没有声优本人的参与,合成声音无法实现真人效果,比如对场景的深刻理解以及带着情感和意图的表演。


人工智能技术正渗透到人们日常生活的方方面面,并将对许多行业产生颠覆性影响,其中声优(配音演员)行业可能会遭受重创。许多美国声优发现,他们无法控制自己的声音被用于各种用途,比如打广告、播放有声读物等。有些声优已经打算放弃自己的职业生涯,因为他们的未来看不到希望,而目前也没有相关法律可以保护他们。

有很多公司都在争相使用雷米·米歇尔·克拉克的声音。作为一名屡获殊荣的声乐艺术家,她用优雅的爱尔兰口音为马自达和万事达的广告配音,同时也充当着微软搜索引擎新必应爱尔兰版的声源。

但在今年1月,克拉克的音响工程师告诉她,他在一个意想不到的地方发现了听起来与克拉克非常相似的声音:在Revoicer.com上,一个名叫“奥利维亚”的女人。只需支付少量的月费,Revoicer的客户就可以访问数百种不同的声音,并通过人工智能支持的工具将它们改造成任何用途,比如为广告配音、背诵公司培训资料或叙述书籍内容。

Revoicer为“奥利维亚”做广告时,配了一张头发花白的女人的照片,看起来像是亚裔,还配了这样的宣传语:“低沉、冷静、善良的声音,非常适合读有声书。”

现年38岁的克拉克满头黑发,一点也不像"奥利维亚"。但当她按下播放键时,迎接她的是让她觉得刺耳的声音,而且听起来就像是她自己的声音:“亲爱的朋友们,你们好,我叫奥利维亚。我的声音温柔而体贴。”

克拉克在接受采访时说:“这太让人觉得奇怪了。当你看到自己的声音被克隆或篡改时,你会觉得受到了侵犯。”

但克拉克并不是唯一一个发现自己无法控制自己声音的人。生成式人工智能(AIGC)是一种基于输入的数据形成文本、图像或声音的技术,它的进步使软件能够以惊人的精度重现人的声音。这种软件可以快速发现模式,将一个小样本与数百万个声音数据库进行比较,允许用户利用简单的文本转语音工具来修改声音,并说出他们输入的任何东西。

这项技术本月突然进入公众视野,一位音乐制作人声称使用人工智能版德雷克和威肯的声音创作了新歌《Heart on My Sleeve》,这首歌在TikTok上迅速传播。许多名人都经历过这种语言深度伪造的困局,包括艾玛·沃森,她的声音被用于播讲阿道夫·希特勒的《我的奋斗》中的段落。美国总统拜登的声音也被造假,说他更喜欢低质量的大麻。

但这项技术将配音演员置于特别危险的境地,他们通常是为有声读物、视频游戏和广告配音的专业人士,姓名身份通常不为人所知。虽然他们的声音通常为人所熟悉,但他们很少拥有那种明星效应来控制自己的声音。法律也没有提供特别的庇护,因为版权条款没有解决人工智能重现人类语言、文本和照片的能力问题。专家们表示,合同中更经常包含某些细则条款,允许公司以各种方式使用声优的声音,甚至将其出售给其他方。

Revoicer.com的开发者尼尔·瑟罗德斯说,该公司通过与微软签署的许可协议使用这种声音,这使得他们可以不受限制地使用克拉克的声音样本。在联系Revoicer.com网站几小时后,该公司承诺从他们的网站上删除克拉克的声音。瑟罗德斯在电子邮件中称:“我们已经承担了责任,但Revoicer.com对克拉克所处的情况不负任何责任。”

几位配音演员表示,他们可能被迫放弃自己的职业生涯,因为他们看不到未来希望,人们可以在不雇佣真人的情况下获得他们的声音。克拉克想知道:是否还有公司愿意花2000美元买她一段30秒的录音,而不是每月花27美元买人工智能克隆的声音。她质问道:“还有多少其他公司在使用我的声音、我的作品,他们在侵害我的生计却未将我这个真人考虑在内?”

“太可怕了”

语音生成软件受益于AIGC的蓬勃发展,它支持ChatGPT等聊天机器人和DALL-E等文本转图像生成器,并在去年迅速提高了复杂性。

利用人工智能生成声音的公司Resemble. AI首席执行官佐哈比·艾哈迈德表示,尽管人工智能长期以来一直在帮助企业成功地模仿语音,但它们制造出来的是机器人的、不符合现实的声音。

然而,这类软件的底层架构和计算能力的改进提升了它们的能力。现在,它可以快速分析数以百万计的声音,发现语音基本单位之间的模式(即音素)。这些软件将原始声音样本与库中大量相似的声音样本进行比较,找到独特的特征来产生逼真的克隆声音。

艾哈迈德说,在这种高级模式识别成为可能之前,语音生成软件需要数千个句子来复制某个声音。现在,这些工具只需几分钟的录音就可以工作。他称:“你不再需要一个小时或者20个小时,而是只需要几分钟甚至几秒钟,基本上就能得到一些听起来90%相似的声音。”

对有些人来说,这种技术进步是一个福音:患有ALS等退行性疾病的人可以使用人工智能储存他们的声音。语音克隆软件让因喉癌手术失声的瓦尔·基尔默为他在《壮志凌云2》(Top Gun: Maverick)中的角色配音。

然而,它也催生出了掠夺性产业。许多人报告说,他们亲朋好友的声音被重现以延续骗局。有些初创公司已经成立,它们从互联网上搜集高质量的语音样本,并将数百个声音打包成库,然后将它们出售给其他公司,用于制作广告、内部培训、视频游戏演示和有声读物,每月收费不到150美元。

倡导组织——全美配音演员协会主席蒂姆·弗里德兰德说,这些初创企业为公司充当“中间人”的角色,提供了一个有利可图的提议:栩栩如生的声音可以说出任何他们需要的东西,而不必处理与真人专业人士相关的更高成本。

弗里德兰德还补充说,生AIGC对他所在行业的影响才刚刚开始,最终这个行业可能会受到极大破坏。他称:“这太可怕了,配音演员在不知不觉中始终在训练可能取代他们的替补。”

“那是我的声音”

一天下午,贝芙·斯坦丁正待在家里,她的孩子们发了一大堆短信,却问了同一个问题:妈妈,你在为TikTok配音吗?

斯坦丁感到十分困惑。这位加拿大配音演员说,她为很多客户做过配音,但TikTok并没有聘请她为任何项目配音,其母公司字节跳动也没有付给她报酬。

但在这款应用上,她发现自己的声音几乎无处不在。作为TikTok标志性的文字转语音功能背后的声音,她在解说猫咪视频、批评不合格的男友、兜售麦当劳汉堡,以及推销她从未听说过的投资工具。

斯坦丁并没有立即发怒,她说:“在大约前三天的时间里,我们玩得很开心。但当我的商业头脑开始运作时,却发现了问题。”

斯坦丁曾于2018年代表中国声学学会为客户工作,并为一款翻译应用录制了自己的声音,但她说合同中没有任何条款允许他们将其声音出售给其他公司。最终,双方达成了庭外和解,TikTok也删除了斯坦汀的声音。

虽然克隆斯坦丁声音的软件可能没有目前的技术那么复杂,但斯坦丁说,她不喜欢未经允许就复制她的声音。她说:“那是我的声音,你不能不付钱就拿走。”

尽管Revoicer.com承诺删除“奥利维亚”的声音,但克拉克表示,她的生计仍处于危险之中,其他第三方网站可能在转卖她的声音。虽然她没有听说过这家公司,但她的朋友们已经转发了她似乎在Instagram上播放广告的事情。“对我来说,这个问题并没有得到解决,”她说。

但作为一个1岁男孩的母亲,克拉克认为自己可能会放弃配音工作。她说:“有些时候会让你觉得自己的未来岌岌可危,现在对我来说绝对是最糟糕的时刻。”

配音演员几乎没有太多的求助手段。直到最近,人工智能还没有对他们的职业构成太大威胁,许多人说他们没有详细分析合同,而是在寻找是否允许公司在个人工作之外使用他们音频的条款。

版权法也不成熟,无法决定当一个人的声音被模仿以获取利润时会发生什么,这也导致执法困难。相对来说,名人可以比不太知名的专业人士获得更多的保护。例如,在环球音乐集团提出担忧后,德雷克的人工智能歌曲上周迅速从YouTube和Spotify上撤下。

知识产权专家、范德比尔特大学法学院教授丹尼尔·热维斯说,美国法律并没有为那些声音被夺走的人提供太多庇护。联邦版权法不保护个人的声音,各州的地方法律也各不相同。即使是在加州,由于其在娱乐行业的突出地位,对声音的保护也更为严格,依然很难断言谁受到了保护。热维斯还称,该州的法律规定,声音必须被认为是独特的,意思是可识别的,并且来自一个众所周知的人,这使得普通配音演员的权利很难受到保护。

全美配音演员协会主席蒂姆·弗里德兰德称,他的同事们必须警惕自己的声音是如何在互联网上被利用的,并密切关注他们合同的细节。

不过,许多配音演员没有加入工会,弗里德兰德的倡导组织正在敦促演员们浏览那些要求他们永久拥有配音权的条款。该组织为演员制作了模板合同,使他们能够控制如何使用他们的声音。

热维斯表示,在欧洲,获得录音版权是比较容易的,而对这些内容进行商业搜集需要得到录音所有者的许可。欧盟也对人工智能采取了更强硬的立场,提出了对人工智能系统风险进行分类的法律。

“它没有我好”

今年1月下旬,迈克·库珀收到了一家公司的电子邮件,声称要出售一个画外音库。他很感兴趣,但很快就在库中找到了自己的声音样本。他说:“当我点击‘播放’、听到我自己的声音回荡在身边时,那一刻让人感觉如此地不真实。”

库珀住在北卡罗来纳州阿什维尔,他成i自己一开始很生气,但后来开始反思为什么会这样。现在出售他的声音的公司可能收购了某家公司,库珀曾在2016年在该公司做过几分钟的配音工作。

库珀记得他的合同中有一项条款规定,他的声音可以在其他地方使用。但他回忆说,他当时认为这是无害的,毕竟他只给了该公司几分钟的音频。“我当时认为风险非常小,”他说。“现在发现我完全错了。”

但库珀称,没有他本人的参与,合成的声音无法提供他所能提供的效果,比如对场景的深刻理解以及带着情感和意图的表演。他说:“它根本比不上我。”