• 在人工智能更新添加了 21 种语言后,AWS 的转录平台现在可以识别 100 种不同的口语。
  • 本次更新主要包括准确度提升、可读性增强以及新人工智能功能的引入。
  • 此更新将提升 AWS 的受欢迎度和竞争力,并为用户提供更便捷的转录体验。

Amazon Transcribe(AWS 的转录平台)现在可以识别 100 多种口语。

在最近的 AWS re: Invent 大会上宣布的本次更新,为现有的 79 种语言新增了 21 种,使总数达到 100 种。新增语言包括南非荷兰语、阿尔巴尼亚语、阿姆哈拉语、亚美尼亚语、阿塞拜疆语、孟加拉语、波斯尼亚语、保加利亚语、缅甸语、克罗地亚语、达里语、爱沙尼亚语、格鲁吉亚语、豪萨语、卡纳达语、高棉语、库尔德语、拉脱维亚语、立陶宛语、马其顿语、马拉雅拉姆语、马拉地语、蒙古语、尼泊尔语、普什图语、波斯语、塞尔维亚语、僧伽罗语、斯洛伐克语、斯洛文尼亚语和泰米尔语。

准确度提升

Amazon Transcribe 利用在大量未标记音频数据上训练的精妙自监督算法,掌握跨多种语言和口音的通用语音模式。通过智能数据采样,它确保了高准确度,尤其是在代表性不足的语言中。

Amazon Transcribe 通过其语音基础模型显著提升了准确度,大多数语言的准确度提升了 20-50%。电话语音识别的提升更为显著,达到 30-70%。

该软件对包括紧急响应单位在内的多个行业都有影响。

根据 Alex Dizengof,Carbyne(一家为紧急呼叫响应人员开发云端关键任务联络中心解决方案的软件公司)的联合创始人兼 CTO 表示:“通过利用 Amazon Transcribe 的新的多语言基础模型驱动的 ASR,Carbyne 将能更好地实现救生紧急服务的民主化,因为每一个人都重要。”

另请阅读:一级方程式使用 AI 执行赛道限制是否比人工更好?

Article image
AWS 的转录平台现在由生成式 AI 提供支持

可读性增强

除了支持大量语言之外,Amazon Transcribe 还提升了可读性和用户体验。这个扩展的 ASR(自动语音识别)模型可以在批处理模式下为现有和新客户提供无缝的语音识别体验,无需修改 API 端点或输入参数。

新 AI 功能

新的 AI 功能包括自动标点、自定义词汇、自动语言识别和自定义词汇过滤,从而提高了系统的灵活性和定制性。

此外,系统对不同口音、噪音环境和声学条件的扩展支持有助于生成更准确的输出,使用户能够更有效地将语音技术集成到应用程序中。

总体而言,这次更新为用户提供了更轻松、更灵活的体验,预计 Amazon Transcribe 的更新将使其广受欢迎且更具竞争力。

另请阅读:OpenAI 追求收入对人类的威胁吗?