- OpenAI 和谷歌使用语音识别工具 Whisper 转录了超过 100 万个 YouTube 视频来训练其 AI 模型。
- OpenAI 使用 YouTube 视频可能违反谷歌的规定,该规定禁止将视频用于独立应用以及通过自动化方式访问。
OpenAI 和谷歌都已转向转录 YouTube 视频以进一步训练其 AI 模型,这可能侵犯创作者的版权。这两家科技巨头在 Meta 上走捷径以获取尽可能多的数据来训练其 AI 模型。
侵犯创作者视频版权
OpenAI 使用 Whisper 转录了超过一百万小时的 YouTube 视频,将转录文本输入到 GPT-4 中,这是 ChatGPT 聊天机器人使用的 AI 系统。拥有 YouTube 的谷歌也转录了视频用于 AI 模型训练。
两家公司的视频转录行为可能侵犯原始制作人的版权。其他将创意内容用于 AI 训练的行为已经引发了与版权和许可相关的诉讼。
OpenAI 使用 YouTube 视频还可能违反谷歌禁止将其视频用于“独立”应用以及通过“自动化方式(如机器人、僵尸网络或爬虫)”访问其视频的规定。
相关阅读:谷歌 DeepMind 首席执行官 Demis Hassabis 因 AI 技术被授予爵士头衔
允许利用公开数据训练 AI
《纽约时报》从谷歌发言人 Matt Bryant 处获悉,该公司不知道 OpenAI 有任何此类使用行为。谷歌员工知道 OpenAI 非法使用 YouTube 内容,但由于谷歌自身也有类似行为,因此选择不干预。此外,谷歌向该报表示,其仅使用创作者已同意此类使用方式的视频来训练 AI。2023 年 7 月,谷歌修改了其服务条款,允许将网上自由访问的内容(如 Google Docs 和 Google Maps 上的餐厅评分)用于进一步训练 AI 模型。

