语音识别

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

#语音识别

专业智能高效的语音处理服务

【python的魅力】：教你如何用几行代码实现文本语音识别

用户11062259 7天前2024-05-05 08:13:23

PocketSphinx 是一个轻量级的语音识别库，它是 CMU Sphinx 开源语音识别系统的一个子集。CMU Sphinx 由卡内基梅隆大学开发，是一个功...

11810

使用Python实现语音识别与处理模型

人类群星闪耀时 18天前2024-04-24 08:20:01

通过本文的介绍，我们了解了语音识别与处理的基本原理和实现方法，并使用Python实现了一个简单的语音识别模型。在实际应用中，我们可以根据需求选择不同的特征提取方...

15110

AI：安装Nemo并进行自动语音识别

Freedom123 2024-03-292024-03-29 16:00:40

注意: base 与 studyNemo 的环境相互独立，并不互通，在不同环境中install的包不能相互使用

7810

Python 语音录制与识别

dandelion1990 2024-03-222024-03-22 18:49:06

本文介绍一些 Python 中常用的语音能力的包，以及如何通过调用云服务商的 API 进行语音识别

13410

盘点一个语音识别库报错的问题

Python进阶者 2024-03-212024-03-21 13:44:36

甚至你可以给客户说，离线版的本身就有语音识别率的问题，会有一些识别错误。在线版的会识别率更高，看看客户是否愿意更改为联网版。先给客户一个心理暗示，让他有个准备。...

8210

AI+低代码+语音识别，让用户闭着眼睛开发

否子戈

腾讯 · 前端开发工程师 (已认证)

2024-03-132024-03-13 14:33:24

上篇文章中提到利用 AI 配合低代码平台，可以让用户快速搭建页面和应用。本文将会对这个问题展开聊聊，不讲概念，直接上干货。

11710

openai whisper 语音识别，语音翻译

崔哥 2024-03-082024-03-08 10:02:20

Whisper 是openai开源的一个通用的语音识别模型，同时支持把各种语言的音频翻译为成英文（音频->文本）。

25010

【RV1126】移植sherpa实时语音识别和TTS文字转语音功能

呱牛笔记 2024-02-282024-02-28 08:55:49

参考：【RV1126】移植kaldi实时语音识别 https://blog.csdn.net/qq_28877125/article/details/13037...

22310

胡歌给大家拜年了！家人们快来跟《繁花》明星学拜年

腾讯云AI 2024-02-162024-02-16 12:07:40

在腾讯云语音识别（ASR）技术的加持下，这只H5融合互动营销和语音识别等前沿科技元素，为用户创造了一场别开生面的新春年味。

11810

语音识别语料归一化处理的方法

阿志小管家 2024-02-022024-02-02 14:49:13

在进行语音识别模型的训练和测试语料收集的过程中，我们需要对收集到的语料进行归一化处理。

10010

深度学习的进展

红目香薰 2024-02-012024-02-01 08:43:08

深度学习在各个领域都有广泛的应用，如自然语言处理中的文本分类和情感分析，计算机视觉中的图像识别和目标检测，语音识别中的语音翻译和语音助手等。近年来，深度学习在上...

11010

小米新一代Kaldi团队论文解读：新型自动语音识别 (ASR) 模型Zipformer诞生之路｜ICLR 2024 Oral

机器之心 2024-01-292024-01-29 14:37:18

近日，小米集团新一代 Kaldi 团队关于语音识别声学模型的论文《Zipformer: A faster and better encoder for auto...

45010

使用 LinkAi 打造自己的知识库和数字人

绿毛龟 2024-01-262024-01-26 10:47:55

随着人工智能技术的不断发展，我们越来越需要一个高效、智能的方式来管理和利用我们的知识。LinkAi 提供的智能语音识别和文本分析技术，可以帮助我们轻松地打造自己...

57811

华为ICT——第八章：语音处理理论与实践02

用户10920956 2024-01-182024-01-18 21:43:50

? 加窗：分帧后，每一帧的开始和结束都会出现间断。因此分割的帧越多，与原始信号的误差就越大，加窗就是为了解决这个问题，使成帧后的信号变得连续，并且每一帧都会表...

11510

华为ICT——第五章语音处理理论与实践

用户10920956 2024-01-182024-01-18 21:08:02

10610

英伟达AI游戏引擎炸场CES！NPC与玩家实时交互，对话动作流畅似真人

量子位 2024-01-112024-01-11 16:07:26

Convai是一个主要面向游戏开发者的数字人平台，提供了语音识别/合成、语言理解与生成等AI对话服务。

14010

AudioGPT 语音技术全覆盖：语音识别、增强、分离、风格迁移等 | 开源日报 No.114

小柒 2023-12-152023-12-15 13:37:18

oil.nvim 是一个类似于 vim-vinegar 的文件浏览器，允许您像普通 Neovim 缓冲区一样编辑文件系统。其主要功能包括支持常见插件管理器、通过...

23410

用活人脑细胞造AI系统！语音识别已成功，可无监督学习｜Nature子刊

量子位 2023-12-122023-12-12 19:26:25

但这种思想下设计的“传统”类脑芯片大多数都是直接基于数字电子原理，完全模仿大脑功能的能力着实有限。

19610

活跃用户

用户11091875
0 文章1 回答0 关注

#语音识别

【python的魅力】：教你如何用几行代码实现文本语音识别

使用Python实现语音识别与处理模型

AI：安装Nemo并进行自动语音识别

Python 语音录制与识别

盘点一个语音识别库报错的问题

AI+低代码+语音识别，让用户闭着眼睛开发

openai whisper 语音识别，语音翻译

【RV1126】移植sherpa实时语音识别和TTS文字转语音功能

胡歌给大家拜年了！家人们快来跟《繁花》明星学拜年

语音识别语料归一化处理的方法

深度学习的进展

小米新一代Kaldi团队论文解读：新型自动语音识别 (ASR) 模型Zipformer诞生之路｜ICLR 2024 Oral

使用 LinkAi 打造自己的知识库和数字人

华为ICT——第八章：语音处理理论与实践02

华为ICT——第五章语音处理理论与实践

英伟达AI游戏引擎炸场CES！NPC与玩家实时交互，对话动作流畅似真人

AudioGPT 语音技术全覆盖：语音识别、增强、分离、风格迁移等 | 开源日报 No.114

用活人脑细胞造AI系统！语音识别已成功，可无监督学习｜Nature子刊

相关产品

活跃用户

用户11091875

热门专栏

机器之心

量子位

新智元

腾讯云智能·AI公有云

VoiceVista语音智能

热门标签

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐