Google 今天升级了其为企业提供的人工智能转录服务Speech-to-Text,提供了扩展的语言支持和更好的方言识别能力,这将扩大该产品的潜在市场。
旗舰增强功能是增加了与七种新语言的兼容性:缅甸语,爱沙尼亚语,乌兹别克语,旁遮普语,阿尔巴尼亚语,马其顿语和蒙古语。语音转文字现在可以翻译总共71种语言的语音。
Google Cloud语音产品经理Calum Barnes表示:“这些进步将我们的语音技术首次带给了超过2亿扬声器,并解锁了更多功能,并提高了全球30亿扬声器的准确性。”
语音转文本作为Google Cloud中的应用程序编程接口提供,不仅将音频文件转换为文本,而且还提供允许企业自定义转录过程的高级功能。这些功能中的三个功能在今天的更新中得到了增强。
第一项功能被称为语音适应,使企业可以调整服务生成的文本。零售商可以培训语音转文字功能,以识别在客户服务呼叫中提到的难以翻译的产品名称,而分析软件提供商则可能希望将一天中的诸如“四分之一到九点”的时间转换为数字形式简化处理。语音适应现已提供68种新语言和方言,包括法语,德语,西班牙语,日语和普通话。
Diarization是一种可以将单词归于特定说话者的功能,它正在获得对10种新语言和方言的支持。Google的“增强型电话模型”已扩展到英式英语,俄语和美国西班牙语。该模型于2018年推出,支持美国英语,可将通话质量较低的音频的笔录准确性提高62%。
最后,新版本的语音转文字功能会自动以18种以前不支持的语言(包括德语,法语,日语和瑞典语)向音频文件添加标点符号。
“这些新的语言和功能将帮助全球数十亿发言人使用我们基于语音的界面和高质量的语音识别,” Barnes写道。
对于使用多种语言提供服务的公司,此更新应该特别方便。例如,使用语音转文本功能来提供实时视频字幕服务或在支持电话期间分析客户情绪的工具的公司现在可以在更多市场上出售其解决方案。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。