Nuance是一家语音识别、自然...
Nuance是一家语音识别、自然语言理解和文本到语音技术领域的全球领导者。该公司的技术可以帮助用户与设备进行自然、直接的交互,通过语音控制、自动化文本处理和人工智能解决方案,提高工作效率、安全性和满意度。Nuance的客户包括医疗保健、金融、航空航天、汽车和消费品等多个领域,他们依靠Nuance的技术来提供高质量、个性化的客户服务和操作体验。除了语音识别和自然语言理解技术外,Nuance还在自动化文本处理领域建立了强大的平台,客户可以使用该平台自动化处理和管理文档、电子邮件和其他商业信息。
在线语音转文字,录音转文字
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练
FineVoice是一种人工智能数字语音解决方案,可以帮助用户增强声音,并实时改变声音。它配有实时变声器,无限的音频和声音效果,录音室质量的录音机,文本到语音,语音到文本。
Notta是由MIND CRUISER LIMITED推出的语音转写软件,主要针对个人使用,并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能,并能实时录音时进行文字直播、插入图片等。
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。