「声网云市场」通过集成技术合作伙伴的能力,为开发者提供一站式开发体验,一站式解决实时互动模块的选型、比价、集成、账号打通和购买,帮助开发者快速添加各类 RTE 功能,快速将应用推向市场,节约 95% 集成 RTE 功能时间。
一、云市场插件使用
地址:API 参考 - 使用插件 - 文档中心 - 声网Agora
二、插件简介(本次大赛推荐使用)
1.【插件】讯飞语音实时转写(中/英)
-
概览:支持中文和英文实时转写,返回带精确时间戳的文字流,可用于生成字幕,适用于各类直播、语音社交、视频会议等场景。
-
使用场景
- 社交娱乐:为互动播客、语音聊天室、虚拟主播等重点场景提供实时转写,打造无障碍语音互动,并且可用于内容监控。
- 在线教育:为直播授课和录屏视频生成字幕,让复习更便利,让教学更轻松。
- 视频会议:为视频和电话会议提供实时双语字幕,适用于跨国会议和大型会议演讲。
- 互动游戏:可用于游戏内语音转写和游戏录屏字幕生成。
- 电商直播:出海直播场景下为本土用户提供翻译字幕,跨境贸易沟通更无阻。
- 听障无障碍:语音转写可以帮助音视频内容触达更多用户。
2. 【插件】云知声实时语音转写(中/英)
-
概览:支持对中文和英文实时转写,对长段音频流做实时识别,达到“边说边出文字”的效果,适用于实时会议、直播字幕等场景。
-
使用场景
- 直播授课:直播授课过程,达到“边说边出文字”的效果。
- 发言上屏:弹幕生成,快速了解用户说话内容,娱乐、教学皆可用。
- 字幕生成:演讲、大会、直播字幕同屏,在电视直播或现场直播过程中提供实时字幕,提升直播效果,还可对内容进行监控。
- 实时会议记录:将视频以及电话会议中的发言内容实时识别为文字,快速记录会议内容,提升会议效率。
- 实时客服记录:将客服电话语音实时识别为文字,实现实时的质检、监控等。
3.【插件】依图实时语音转写(中文)
-
功能介绍:依图实时语音转写提供流式语音识别能力,支持中文普通话,并且兼容多种口音。一边接收音频数据,一边提供转写结果,让您能够实时获取和利用文字信息。
- 实时转写:高字准、低延时地将不限时长的实时音频流转写成文字。
- 时间戳:转写文字的同时提供该转写结果对应时间戳,可用于vlog字幕等场景。
- 专有名词优化:支持添加特定行业特定场景下的具体专业名词,转写结果将更倾向于行业专有名词词,更贴合用户场景实际需要。
- 支持按字+按句返回识别结果:识别结果支持按字+按句返回模式,可用于卡拉OK式效果展示,亦可用于智能纠错的实时字幕展示效果。
-
使用场景:目前已广泛应用于视频直播、语音聊天室、语音FM、教育、会议、游戏等领域。
4. 【插件】云知声口语评测(中/英)
-
概览:基于语音识别和评价技术对发音做客观打分,反馈发音正误和定位问题,有助于语音教学,发音练习,也可测试考生的口语水平。
-
使用场景
- 口语练习和作业:直播课随堂练习,课后下发课程配套的口语练习和单元测试题,增加口语练习机会。
- 人机对话考试:基于计算机自动评判或计算机辅助专家对口语考试结果进行评价,提升打分稳定性。
- 智能化学习:AI语音识别互动课堂,增加学生互动;智能纠音诊断技术,针对性解决发音问题。
5. 【插件】相芯美颜道具高级版
-
功能介绍
-
基础美颜
1. 美肤功能:2款磨皮效果、美白、红润。
2. 基础滤镜功能:提供不少于45款基础滤镜。
3. 所有美颜效果参数可调节。 -
高级美颜
1. 美肤功能:3款磨皮效果、美白、红润、镜化、亮眼、美牙、去黑眼圈、去法令纹。
2. 美型功能:包括大眼、圆眼、5款脸型调整、瘦颧骨、瘦下颌骨、额头调整、下巴调整、瘦鼻、嘴巴调整、开眼角、眼距、眼睛角度、长鼻,缩人中、微笑嘴角等。
3. 美颜滤镜功能:提供丰富的滤镜效果,不少于75款基础滤镜。
4. 提供专业便携的制作工具,支持用户自定义滤镜道具。
-
-
使用场景:目前已广泛应用于视频直播、短视频拍摄、场景营销、拍照应用、在线教育等领域。
6. 【插件】皮卡智能 AI 虚拟背景
-
概览:皮卡智能研发的 AI 实时视频背景分割 SDK 是基于 AI 图像算法模型生成的分割技术,深度应用于医疗、金融、教育、互联网的交互式业务场景,目前已经成功实现与国内大型 SaaS 软件厂商、国内知名医院、国内知名商业银行等共同打造远程云端场景业务。
-
产品优势
1. 毫秒级响应,发丝级抠图,算法模型更新频率高,平均每月迭代一次。
2. 无需专业场地设备,常规的互联网终端即可实现 100% 功能。
3. 本地化部署计算,两行代码即可调用,无需担忧数据泄露,接入简单,安全稳定。 -
使用场景:互联网医疗、互联网金融、互联网教育、视频直播、网红 IP 带货等。