腾讯云语音识别产品提供开放实时语音识别、录音文件识别、语音流异步识别、录音文件识别极速版和一句话识别五种服务形式,满足不同类型开发者需求。现在推出特惠活动,低至1元起。
一、新用户专享,低至1元起!
提供业界非常具有性价比的语音识别服务,每人限购1件 低至1元。
- 实时语音识别,支持中、英、粤、韩、日、泰、上海话,新手专享价9.9元/30小时;
- 一句话识别,支持中、英、粤、日、上海话,新手专享价9.9元/30千次;
- 录音文件识别,支持中、英、粤、日、泰、上海话,新手专享价9.9元/60小时;
- 一句话识别,支持中、英、粤、日、上海话,企业客户专享价1元/30千次。
二、超值折扣专区,不限新老用户!
提供全球领先的人工智能技术,共享 AI 领域最新的应用场景和解决方案 低至6折。
- 语音识别-实时语音识别、一句话识别、录音文件识别,低至6折,特惠价54元;
- 语音合成-标准音色,支持中文、英文、中英文混读以及粤语,低至7折,特惠价980元;
- 人气资源包搭配套餐:文字识别+语音识别,特惠价7500元起。
三、语音识别-应用场景介绍
1、呼叫中心录音质检
痛点:
传统质检严重受限于人的工作效率和人力成本
只能抽检不能全检,难以评估客服的真实工作质量
解决方案:
语音识别将电话录音识别为文本,再通过质检规则对文本进行分析,识别不符合规范的服务通话记录。
2、短视频字幕
痛点:
边拍视频边说话,没有字幕不能立即发布
拍完视频还需要二次编辑,手动输入字幕
解决方案:
通过录音文件识别极速版,实现了用户边拍边说,将语音内容直接显示在视频上。
3、视频理解
痛点:
在直播、音频分享等平台,有海量音视频需要理解
用来做质检审核或者标签推荐,基于人力很难实现
解决方案:
录音文件识别 / 语音流异步识别 / 录音文件识别极速版可将视频中的音频(流)通过音视频专属模型进行转写,可满足多种输入、不同时延的需求。
四、语音合成-应用场景介绍
1、机器人发声
在客服机器人、服务机器人等场景中,与语音识别、自然语言处理等模块联动,打通人机交互的闭环。实现高品质的机器人发声,使得人机交互更流畅自然。
2、有声读物制作
将电子教材、小说等文本材料,以文本文件的形式导入离线语音合成引擎,产生完整的可重复阅读的有声教材或者有声小说,方便用户随时取用。
3、语音播报
在语音导航应用、新闻类 APP 中,语音合成可以快速生成高质量的播报音频,实现在开车、走路等不方便阅读消息的情况下,音频消息的即时传达。