语音 - 标签 - 腾讯云开发者社区-腾讯云

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

#语音

GNU Radio FFT模块窗函数对比

Gnep@97 2天前2024-05-09 08:05:51

GNU Radio 中 FFT 模块的窗函数包括以下几种：矩形窗（Rectangular Window）、汉明窗（Hamming Window）、汉宁窗（Han...

6710

KT148A语音芯片串口版本播放音乐的时候，直接导致单片机工作异常

清月电子 4天前2024-05-07 10:55:59

在使用你们KT148A串口版本播放音乐的时候，直接导致单片机工作异常，测了一下供电发现每次播放音乐的时候，供电会有很大波动。看了一下你们的手册，说是带载能力不够...

6010

情感AI产品Hume.AI CEO Alan Cowen最新访谈视频（42分钟）

朱晓霞 5天前2024-05-06 14:49:32

一、Alan Cowen个人背景 1.UC Berkeley的心理学博士，在研究人类情感方面发表了40多篇论文。 2.在Google建立了情感计算团队。 ...

9310

【python的魅力】：教你如何用几行代码实现文本语音识别

用户11062259 6天前2024-05-05 08:13:23

SpeechLib 是微软提供的一个用于语音功能的 COM 库，它允许开发者在 Windows 平台上进行文本到语音（TTS）和语音识别的开发。通过 Speec...

11810

黑科技：微信可以设置空白昵称了，还能发空白朋友圈和空白微信消息

苏生不惑 11天前2024-04-30 18:31:00

根据官方消息，微信文字，语音，表情包，图片等在2分钟内可撤回，word，excle，pdf，ppt等文件可在3小时内撤回。

16910

4个月用户增长20倍！腾讯云音视频助力游戏语音公司Oopz高速成长

腾讯云音视频

腾讯 · 行业应用产品经理 (已认证)

11天前2024-04-30 15:08:40

作为国内一款集语音开黑、社区交友、AI聊天于一体的游戏语音软件，Oopz于2023年12月开放公测。凭借腾讯云实时音视频TRTC的技术支持，快速获得了游戏玩家的...

15520

TTS它又又又来了！17.8k Star！OpenVoice V2只需一小段参考音频即可实现高效的声音克隆！

Python兴趣圈 15天前2024-04-26 20:15:33

它能够仅使用一小段人声就实现语音克隆。这意味着您可以通过输入极少的语音样本，轻松生成高质量的语音合成。

42210

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

机器之心 15天前2024-04-26 20:10:17

4 月 26 日，科大讯飞发布讯飞星火大模型 V3.5 的功能上新，其中一个重点就是面向用户各种场景中高效获取信息需求，发布首个长文本、长图文、长语音的大模型，...

10410

MiniMax不声不响出了款让人惊喜的生产力产品：「海螺AI」大测评

机器之心 15天前2024-04-26 20:03:07

与 Claude -3 Opus、Mistral-Large、Gemini-1.5-Pro 等领先大语言模型相比，“海螺AI"的一大亮点是支持语音交互，也是我们...

34910

在线教程丨刘强东数字人首秀交易额破5千万！用GeneFace++ 生成实时说话数字人

HyperAI超神经 15天前2024-04-26 17:35:08

近日，京东创始人刘强东化身「采销东哥 AI 数字人」，在京东家电家居和超市的采销直播间开启了自己的直播首秀。此次直播活动观看人次超 2 千万，交易总额超 5 千...

12410

五一Python抢票神器来了

Python小二 15天前2024-04-26 16:47:50

还在为五一回家抢不到火车票发愁吗？今天介绍一个Python抢票神器，希望对你有帮助。

11510

ElevenLabs：创新语音技术的个性化体验

程序那些事儿 15天前2024-04-26 15:44:19

ElevenLabs 是一个创新的在线平台，它将人工智能技术与个性化语音合成相结合，为用户提供了一个全新的语音克隆和语音生成体验。无论是创建有声读物、音频内容还...

7910

ICCV 2023 | Imitator：个性化语音驱动的 3D 人脸动画

用户1324186

上海交通大学 · 研究员 (已认证)

15天前2024-04-26 14:50:09

图 1：Imitator 是一种用于个性化语音驱动 3D 人脸动画的新方法。给定音频序列和个性化风格嵌入作为输入，我们生成特定人物的运动序列，并为双唇辅音（'m...

15210

CVPR2024 | ProbTalk：变化且协调的整体语音运动生成

用户1324186

上海交通大学 · 研究员 (已认证)

15天前2024-04-26 14:49:37

用语音驱动来生成逼真的全身动作对于提供更沉浸式和互动式用户体验至关重要。这个任务引起了相当多的研究兴趣。Habibie等人提出的早期方法使用确定性回归模型将语音...

12510

基于RT-Thread的智能家居助手

二哈侠 15天前2024-04-26 11:00:12

智能家居助手主要基于RT-Thread开发的，该系统主要分为语音子系统，环境监测子系统，智能控制子系统，智能网关子系统，音乐播放器，云端以及应用软件七大部分。语...

7710

体验AI革命：探索各种改变游戏规则的生成式AI工具

用户3578099 16天前2024-04-25 15:11:58

在AI的世界里，每一秒都充满了无限可能。从游戏开发到电影制作，从虚拟现实到音乐生成，AI工具正以前所未有的速度改变着我们的生活方式。在本文中，将探索一系列令人印...

8610

使用Python实现语音识别与处理模型

人类群星闪耀时 17天前2024-04-24 08:20:01

语音识别与处理是指将语音信号转换成文本形式的过程，通常包括语音信号的预处理、特征提取、模型训练和识别等步骤。语音识别与处理技术广泛应用于语音助手、语音搜索、语音...

14910

[AI OpenAI-doc] 文字转语音

从零开始学AI 18天前2024-04-23 11:20:25

音频 API 提供基于我们的 TTS（文本到语音）模型的语音端点。它配备了 6 种内置语音，并可用于：

16510

GPT-SoVITS - 1分钟人声样本，完成声音克隆

崔哥 20天前2024-04-21 09:43:58

集成了语音伴奏分离、训练集自动分割、中文ASR、文本标注等工具，帮助初学者创建训练数据集和GPT/SoVITS模型。

21910

脑电合成自然语音！LeCun转发Nature子刊新成果，代码开源

量子位 23天前2024-04-18 13:07:01

具体来说，来自纽约大学的研究团队开发了一个新型的可微分语音合成器，可以利用一个轻型的卷积神经网络将语音编码为一系列可解释的语音参数（如音高，响度，共振峰频率等）...