谷歌和 OpenAI 利用 YouTube 视频训练 AI 模型

OpenAI 和谷歌使用语音识别工具 Whisper 转录了超过 100 万个 YouTube 视频来训练其 AI 模型。
OpenAI 使用 YouTube 视频可能违反谷歌的规定，该规定禁止将视频用于独立应用以及通过自动化方式访问。

OpenAI 和谷歌都已转向转录 YouTube 视频以进一步训练其 AI 模型，这可能侵犯创作者的版权。这两家科技巨头在 Meta 上走捷径以获取尽可能多的数据来训练其 AI 模型。

侵犯创作者视频版权

OpenAI 使用 Whisper 转录了超过一百万小时的 YouTube 视频，将转录文本输入到 GPT-4 中，这是 ChatGPT 聊天机器人使用的 AI 系统。拥有 YouTube 的谷歌也转录了视频用于 AI 模型训练。

两家公司的视频转录行为可能侵犯原始制作人的版权。其他将创意内容用于 AI 训练的行为已经引发了与版权和许可相关的诉讼。

OpenAI 使用 YouTube 视频还可能违反谷歌禁止将其视频用于“独立”应用以及通过“自动化方式（如机器人、僵尸网络或爬虫）”访问其视频的规定。

允许利用公开数据训练 AI

《纽约时报》从谷歌发言人 Matt Bryant 处获悉，该公司不知道 OpenAI 有任何此类使用行为。谷歌员工知道 OpenAI 非法使用 YouTube 内容，但由于谷歌自身也有类似行为，因此选择不干预。此外，谷歌向该报表示，其仅使用创作者已同意此类使用方式的视频来训练 AI。2023 年 7 月，谷歌修改了其服务条款，允许将网上自由访问的内容（如 Google Docs 和 Google Maps 上的餐厅评分）用于进一步训练 AI 模型。

谷歌和 OpenAI 利用 YouTube 视频训练 AI 模型

侵犯创作者视频版权

允许利用公开数据训练 AI

信号简报

运营足迹

市场背景

关注事项

深度趋势背景

战略圈

领导联盟

战略圈简报

领导联盟简报