
IBM公司与Deepgram公司正式宣布建立合作关系,双方将把Deepgram的语音技术整合至IBM的watsonx Orchestrate平台,而Deepgram也由此成为IBM在语音技术领域的首个合作伙伴。
依据双方协议,Deepgram的语音转文字与文字转语音技术将被整合到IBM旗下用于搭建和管理人工智能代理及自动化工作流程的平台里。企业方面称,此次集成的目的是让数字代理具备企业级的转录、实时字幕以及自然语音交互能力。
公司指出,这次合作能让企业在实时且具备可扩展性的前提下,搭建语音支持的代理与工作流程,用于客户支持、通话分析以及语音驱动的数据输入等方面。
这一合作体现出企业环境下对会话界面的需求正不断提升,原因在于各类组织都期望简化与软件代理之间的互动。据Grand View Research公司的预测,全球语音及语音识别市场的规模会从2023年的202亿美元出发,以每年接近15%的增速扩张,到2030年将达到537亿美元。
公司称,Deepgram的技术可应对背景噪音、多样口音以及真实对话等方面的挑战。该技术支持35种语言,其中包含多种阿拉伯语与印度语变体,还提供定制调优和实时字幕功能。公司表示,其在实际应用中准确率超过90%,延迟则低于300毫秒。
Deepgram借助应用程序编程接口,向用户提供语音转文字、文字转语音以及语音转语音的功能服务。据该公司透露,目前已有超20万名开发者在使用其云端与自托管API。同时,它还表示已处理的音频时长累计超过5万年,并且为独立软件供应商、企业及合作伙伴等各类客户完成了超1万亿字的转录工作。
该集成对watsonx的功能进行了扩展,watsonx是一套AI产品组合,涵盖构建、训练和管理基础模型的工具,以及在业务流程中协调AI代理等内容。IBM将watsonx视为其战略的核心部分,目标是提供能与混合云环境集成的开放且专注于企业需求的AI。