人工智能如何让口音消失

作者: aeks | 发布时间: 2025-10-28 14:49 | 更新时间: 2025-10-28 14:49

学科分类: 人工智能 教育学 社会学 语言学

这是一则BoldVoice的广告,这是一款人工智能“口音训练”应用。点击几下后,我进入了它的“口音神谕”功能,该功能号称能猜出我的母语。我读完一段长句子后,算法宣称:“朋友,你的口音是韩语。”有点得意,但确实厉害——我确实是韩国人。

我在美国生活了十多年,英语不仅流利,甚至可以说是“超流利”——单说发音清晰度,可能就比全国平均水平高出两个标准差。但这仍不意味着“母语水平”。我学英语的时间稍晚,错过了习得母语口音的关键窗口期。这种差异在不同时代可能会带来严重后果。《士师记》中记载,基列人曾用“示播列”(shibboleth)一词识别并屠杀逃亡的以法莲人,因为以法莲人发不出“sh”音,会说成“西播列”(sibboleth)。1937年,多米尼加独裁者拉斐尔·特鲁希略下令处死任何无法正确发西班牙语“欧芹”(perejil)一词的海地人,这就是著名的“欧芹大屠杀”。

因此,当“口音神谕”持续听我说话时,我感觉风险很高——有一次给我打了89分(“轻微口音”),另一次是92分(“母语或接近母语水平”)。这种差异令人不安。运气不好的话,我可能就“被屠杀”了。为了提高“生存几率”,我注册了为期一周的免费试用。

就像人工智能涉足其他所有领域一样,现在它也盯上了口音。Krisp和Sanas等公司为客服人员提供实时口音“中和”服务,能将菲律宾客服的声音变得更受俄亥俄州客户的欢迎。反人工智能阵营的直接反应是,这是“数字洗白”,是对帝国式、单一化英语的屈服。这通常被视为种族问题,或许是因为这些服务的广告中多是有色人种,且客服中心位于印度、菲律宾等地。

但这种判断可能过于草率。为了社交优势而调整说话方式是个老话题了。想想萧伯纳的《皮格马利翁》及其音乐剧改编版《窈窕淑女》,核心就是希金斯教授重塑伊莱莎·杜利特尔的伦敦东区口音。就连德国著名哲学家约翰·戈特利布·费希特搬到耶拿后,也改掉了自己的萨克森口音,因为他担心如果说话带着乡土味,人们不会认真对待他。

这并非过去的遗迹。2022年英国一项研究发现,“口音声望等级”依然存在,且自1969年以来几乎没有变化——四分之一的在职成年人表示在工作中遭遇过某种形式的口音歧视,近一半的受访者称在社交场合被嘲笑或被区别对待。

在Hacker News上宣布BoldVoice推出的帖子中,有位评论者写道:“比起纠正口音,我更愿意努力创造一个口音不那么重要的世界。”好吧,去跟这个国家无数努力区分“beach(海滩)”和“bitch(泼妇)”、“coke(可乐)”和“cock(公鸡)”之间危险发音鸿沟的韩国人说说看。这种网上评论典型地充满了伪善的空话,是只有母语为英语的人,或故意无视非母语者日常所受屈辱的人,才能轻易占据的道德高地。

此外,最严厉的评判并非总是来自母语者。在ESL(英语作为第二语言)课堂和移民群体中,常常存在一种微妙的同化等级——口音能区分定居已久者和新来者。“所有口音都平等”在语言学上是对的,但在社会学上是错的。

诊断之后,BoldVoice给我标出了几个“重点关注领域”:th音(不足为奇);词尾辅音清化,比如“did”中的“d”,我发得像“dit”;还有延长“seat”等词中的“ee”元音,避免读成“sit”中的短“i”音。

那么,我的口音变了吗?我永远不会知道了。我只坚持了三节课。坐在家里对着手机重复“think, thought, thirty”,这种羞耻感有点荒谬,让我想起一个悲伤的夜晚——我曾笨拙地对着镜子模仿YouTube上的舞蹈动作。

或许在我刚学英语时,当我还因浓重的口音而自卑时,会更渴望这样的工具。但多年来,随着口音逐渐减轻,它反而固化成了另一种东西:一种便捷的声音速记,传递着我的身份。这款应用的练习让我清楚地意识到我可能失去什么——磨平我说话中所有的外国痕迹,就等于抹去那个能认出是“我”的声音指纹。

原来,Instagram上第一则广告里的女人是BoldVoice的联合创始人,一位阿尔巴尼亚移民。对于她,以及任何觉得这款应用有用的人,我想说:祝一切顺利。我们永远不知道何时会被要求发“欧芹”这个音。

标签: AI口音训练 BoldVoice 口音中和 口音歧视 数字洗白