深度伪造 AI 的工作原理、用途与风险

深度伪造人工智能利用先进算法创建具有说服力的虚假内容，既展现了技术奇迹，也带来了潜在威胁。这引发了深度伪造 AI 如何工作的问题。
其法律地位仍模糊不清，仅有少数几个州有具体的法规。
尽管存在法律地位，深度伪造仍构成重大风险，包括勒索、政治操控和欺诈，这凸显了制定全面立法和提高认识的紧迫性。

深度伪造 AI 是一种能够制造逼真假图像、音频和视频的人工智能形式。它融合了“深度学习”和“伪造”，涵盖了技术及其生成的欺骗性内容。深度伪造可以将现有内容中的人物替换，或者编造全新的场景，展现从未发生过的事件或言论。深度伪造的主要危害在于其能够传播看似真实的虚假信息。现在让我们探索深度伪造 AI 的工作原理。

另请阅读：大家都在用什么 AI 语音生成器？

另请阅读：制药行业中的生成式 AI

什么是深度伪造 AI？

深度伪造 AI 是一种用于制造逼真假图像、音频和视频骗局的人工智能。它将深度学习与伪造术相结合，转换现有源内容或生成全新场景。术语“深度伪造”既涵盖技术，也涵盖由此产生的虚假内容，融合了深度学习和伪造的概念。

这些深度伪造通常涉及篡改现有内容，例如将一个人替换为另一个人，或者创建全新内容，描绘个人从事他们从未做过的行为或发表言论。值得注意的是，深度伪造因可能以可信来源为幌子传播虚假信息而构成重大风险。例如，2022 年出现了一段深度伪造视频，其中乌克兰总统弗拉基米尔·泽连斯基向他的部队下达了投降命令。

人们对深度伪造在选举和宣传中的滥用表示担忧，这凸显了它们带来的严重威胁。然而，同样重要的是要认识到深度伪造在视频游戏、娱乐和客户服务（如电话转接和接待服务）等各种应用中也有合法用途。

深度伪造 AI 是如何工作的？

深度伪造技术使用两个关键算法，即生成器和判别器，来生成和优化伪造内容。最初，生成器根据期望的输出构建数据集，生成初始的虚假数字内容。随后，判别器评估初始内容的真实性，区分真实与人为。通过反复迭代过程，生成器提高其生成有说服力内容的能力，而判别器增强其检测缺陷以供生成器纠正的能力。

这种生成器和判别器算法的组合构成了生成对抗网络（GAN）。GAN 利用深度学习技术识别真实图像中的模式，并利用这些模式生成合成内容。例如，在创建深度伪造照片时，GAN 从不同角度检查目标的多张图像，以捕获全面的细节和视角。同样，在开发深度伪造视频时，GAN 从多个视角分析视频内容，同时仔细检查行为线索、动作和语音模式。随后，这些数据经过判别器的多次评估，以优化最终输出的真实感。

深度伪造视频通常通过两种方法之一制作。首先，可能使用包含目标人物的原始视频，操纵内容以描绘该人从未实际执行过的动作或发表过的言论。其次，深度伪造视频可能涉及将目标人物的脸替换到另一个人的视频片段上，通常称为换脸。

创建深度伪造有多种方法

使用源视频：由神经网络驱动的深度伪造自编码器仔细检查源视频，以掌握目标的重要属性，如面部表情和肢体语言。然后使用编码器-解码器系统将这些特征整合到原始视频中。
生成音频深度伪造：音频深度伪造涉及 GAN 复制一个人的声音，根据语音模式构建模型，并利用该模型操纵声音说出任何想要的话。这种技术常用于视频游戏开发。
对口型：深度伪造创建的另一种流行方法是对口型，该技术将录音与相应视频对齐，创造出视频中的人正在说出录音的幻觉。如果音频本身是深度伪造，则增加了额外的欺骗层。这种方法由循环神经网络支持。

开发深度伪造所需的技术

深度伪造技术的兴起得益于各种关键技术的进步：

GAN 神经网络构成了深度伪造开发的骨干，采用生成器和判别器算法。

卷积神经网络（CNN）分析视觉数据模式，对面部识别和运动跟踪等任务至关重要。

自编码器是另一种神经网络技术，它识别目标的相关属性，如面部表情和身体动作，并将其转移到源视频中。

自然语言处理（NLP）算法通过分析语音属性并生成相应文本来生成深度伪造音频。

高性能计算为深度伪造创建提供了必要的大量计算能力。

根据美国国土安全部关于“深度伪造身份日益增长的威胁”的报告，有几种工具可以快速生成深度伪造，包括 Deep Art Effects、Deepswap、Deep Video Portraits、FaceApp、FaceMagic、MyHeritage、Wav2Lip、Wombo 和 Zao。

深度伪造服务于多种目的

艺术：用于通过重新混音艺术家的现有作品来创作新音乐。

勒索和声誉损害：涉及将目标置于妥协场景中，如非法活动或露骨行为，以敲诈或诽谤他们。

呼叫响应服务：为电话转接和接待服务提供个性化响应。

客户电话支持：使用伪造声音处理日常任务，如账户查询或投诉。

娱乐：用于电影和游戏中，操纵演员的声音或创作讽刺和模仿内容。

虚假证据：制造误导性图像或音频以影响法律程序。

欺诈：冒充个人以获取敏感信息或访问权限。

错误信息和政治操控：传播虚假新闻以影响公众舆论或制造混乱。

股票操纵：创建虚假材料以影响股票价格。

短信：未来可能用于复制用户的短信风格，根据美国国土安全部关于深度伪造身份的报告。

深度伪造在法律上是否被允许？

深度伪造通常在法律范围内，但由于其潜在威胁，给执法部门带来了挑战。当违反现行法律（如儿童剥削、诽谤或仇恨言论）时，它们才成为非法。

只有三个州有关于深度伪造的具体立法。德克萨斯州禁止影响选举的深度伪造，弗吉尼亚州禁止传播深度伪造色情内容，加利福尼亚州限制选举临近时的政治深度伪造和未经同意的深度伪造色情内容。

缺乏全面法律的原因是人们对深度伪造技术及其影响普遍不熟悉，这使得受害者基本上得不到保护。

深度伪造相关的风险有哪些？

尽管存在法律地位，深度伪造仍构成重大风险：

它们通过将目标置于妥协场景中来实施勒索和声誉损害。

它们助长政治错误信息，被民族国家行为者用于恶意目的。

它们通过生成候选人的虚假视频来干预选举。

它们被用于股票操纵，通过伪造内容影响市场价格。

它们通过冒充个人以访问财务和个人数据来助长欺诈。

深度伪造 AI 是如何工作的？

什么是深度伪造 AI？

深度伪造 AI 是如何工作的？

创建深度伪造有多种方法

开发深度伪造所需的技术

深度伪造服务于多种目的

深度伪造在法律上是否被允许？

深度伪造相关的风险有哪些？

信号简报

运营面

市场背景

关注事项

深度趋势背景

战略圈

领导联盟

战略圈简报

领导联盟简报