您当前的位置是:  首页 > 技术 > 企业通信 > 技术 > 语音通信 > 技术动态 >
  首页 > 技术 > 企业通信 > 技术 > 语音通信 > 技术动态 > 谷歌开源Live Transcribe语音识别转文字工具

谷歌开源Live Transcribe语音识别转文字工具

2019-08-19 14:26:55   作者:   来源:CTI论坛   评论:0  点击:


  扫描二维谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎,它可以将语音或对话实时转录为文字,还能够为听障人士提供帮助。
  Live Transcribe 是谷歌于今年2月推出的一款Android应用程序,它的语音识别由谷歌最先进的Cloud Speech API提供。但是,依赖于云引入了一些复杂性,不断变化的网络连接、数据成本和延迟等等都带来一些考验。因此,谷歌把它开源出来,希望开发人员在已有的基础上进一步构建和开发。
  Cloud Speech API目前无法支持无限的音频流,团队采取了一些措施来解决这一难题,例如在达到超时之前关闭并重新启动流式传输请求,这将有效减少会话中丢失的文本量。
  值得一提的是,Live Transcribe支持超过70种语言,并能够根据语音自动识别语种,其中也包括中文。
  另外,由于是提供实时语音转录,转录出来的文本会随着语音的输入不断发生变化,降低延迟自然十分必要。该引擎能够大大降低延迟率,这都要归功于它的自定义Opus编码器。
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

各大党政科技媒体争相报道亿联网络
各大党政科技媒体...
各大党政科技媒体争相报道亿联网络 [详细]
小i智慧学堂
小i智慧学堂
  小i智慧学堂是一个AI应用人才培养与发展平台,致力...[详细]
北京InfoComm China 2019
北京InfoComm Ch...
  一年一度专业视听和集成体验行业盛会北京InfoComm ...[详细]
2019可信云大会在京召开
2019可信云大会在...
  7月2日,由中国信息通信研究院主办、中国IDC圈协办...[详细]

CTI论坛会员企业