• OpenAI 和谷歌使用语音识别工具 Whisper 转录了超过 100 万个 YouTube 视频来训练其 AI 模型。
  • OpenAI 使用 YouTube 视频可能违反谷歌的规定,该规定禁止将视频用于独立应用以及通过自动化方式访问。

OpenAI 和谷歌都已转向转录 YouTube 视频以进一步训练其 AI 模型,这可能侵犯创作者的版权。这两家科技巨头在 Meta 上走捷径以获取尽可能多的数据来训练其 AI 模型。

侵犯创作者视频版权

OpenAI 使用 Whisper 转录了超过一百万小时的 YouTube 视频,将转录文本输入到 GPT-4 中,这是 ChatGPT 聊天机器人使用的 AI 系统。拥有 YouTube 的谷歌也转录了视频用于 AI 模型训练。

两家公司的视频转录行为可能侵犯原始制作人的版权。其他将创意内容用于 AI 训练的行为已经引发了与版权和许可相关的诉讼。

OpenAI 使用 YouTube 视频还可能违反谷歌禁止将其视频用于“独立”应用以及通过“自动化方式(如机器人、僵尸网络或爬虫)”访问其视频的规定。

相关阅读:谷歌和斯坦福研究人员推出 AI 事实核查工具

相关阅读:谷歌 DeepMind 首席执行官 Demis Hassabis 因 AI 技术被授予爵士头衔

允许利用公开数据训练 AI

《纽约时报》从谷歌发言人 Matt Bryant 处获悉,该公司不知道 OpenAI 有任何此类使用行为。谷歌员工知道 OpenAI 非法使用 YouTube 内容,但由于谷歌自身也有类似行为,因此选择不干预。此外,谷歌向该报表示,其仅使用创作者已同意此类使用方式的视频来训练 AI。2023 年 7 月,谷歌修改了其服务条款,允许将网上自由访问的内容(如 Google Docs 和 Google Maps 上的餐厅评分)用于进一步训练 AI 模型。