• 基础模型 (FM) 是训练于海量数据集的大型深度学习神经网络,它们改变了计算机科学家处理机器学习 (ML) 的方式。
  • 数据科学家不再从零开始开发人工智能,而是利用底层模型作为起点来开发机器学习模型。

基础模型是基于深度神经网络和自监督学习技术,在大型、广泛来源的数据集上训练而成的 AI 模型。

基础模型的概念

基础模型 (FM) 是训练于海量数据集的大型深度学习神经网络,它们改变了计算机科学家处理 机器学习 (ML) 的方式。数据科学家不再从零开始开发 人工智能 (AI),而是利用底层模型作为起点来开发机器学习模型,以更快、更经济地支持新的应用。基础模型这一术语由研究人员提出,用来描述在广泛、无标签的通用数据上训练,并能执行各种通用任务的机器学习模型,例如理解语言、生成文本和图像,以及使用自然语言进行对话等。

另请阅读:各国自研 AI 模型,加剧英伟达芯片需求增长

基础模型的独特之处

基础模型的一大独特特点是其适应性。这些模型能够根据输入提示,以高度准确性执行各种不同任务。一些任务包括自然语言处理 (NLP)、问题回答和图像分类。基础模型的规模和通用特性使其有别于传统的机器学习模型,后者通常执行特定任务,例如分析文本情感、分类图像和预测趋势。基础模型可以作为开发更专业的下游应用的基础模型。这些模型是十多年研发工作的结晶,因此其规模和复杂性也在不断增长。

基础模型能做什么

语言处理: 这些模型具有回答自然语言问题的非凡能力,甚至能够根据提示撰写简短的脚本或文章。它们还可以利用 NLP 技术进行语言翻译。

视觉理解: 基础模型在计算机视觉方面表现出色,特别是识别图像和物理对象。这些功能可能被用于自动驾驶和机器人等应用中。另一个功能是通过输入文本生成图像,以及编辑照片和视频。

代码生成: 基础模型能够根据自然语言输入生成各种编程语言的计算机代码。您还可以使用基础模型来评估和调试代码。

推动 AI 发展: 生成式 AI 模型利用人类输入来学习和改进预测结果。这些模型一个重要但有时被忽视的应用是它们支持人类决策的能力。潜在用途包括临床诊断、决策支持系统和分析,通过微调现有基础模型来开发新的 AI 应用。

另请阅读: 温度计技术可减少 AI 模型过度自信