当前位置：主页 > 查看内容

语音识别天池新人赛

发布时间：2021-07-12 00:00| 有位朋友查看

简介：数据集来自Eating Sound Collection数据集中包含20种不同食物的咀嚼声音赛题任务是给这些声音数据建模准确分类。作为零基础入门语音识别的新人赛本次任务不涉及复杂的声音模型、语言模型希望大家通过两种baseline的学习能体验到语音识别的乐趣。 train文件夹……

数据集来自Eating Sound Collection，数据集中包含20种不同食物的咀嚼声音，赛题任务是给这些声音数据建模，准确分类。作为零基础入门语音识别的新人赛，本次任务不涉及复杂的声音模型、语言模型，希望大家通过两种baseline的学习能体验到语音识别的乐趣。

train文件夹：完整的训练集；
train_sample文件夹：部分训练集；
test文件夹：测试集；
目前由于天池实验室存储限制，在DSW上参与本场比赛建议使用压缩后的数据集

赛题使用准确率（Accuracy）衡量选手结果与真实标签的差异性。

源码解读
在这里插入图片描述

建立字典与逆字典

遍历数据文件，计算梅尔频谱

搭建cnn网络

训练模型

在这里插入图片描述
预测测试集

提交结果

；原文链接：https://blog.csdn.net/qq_39822289/article/details/115712549
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：个人理解的比特币 下一篇：没有了

随机推荐

Visual Studio 2017使用淘宝镜像的方法

使用VS2017还原NPM包时，因为要访问外网，安装时间特别漫长，而且等待很长时间也...
ASP 高级模板引擎实现类

复制代码代码如下: Class template Private c_Char, c_Path, c_FileName, c_Con...
正则表达式截取字符串的方法技巧

有这么一段字符串: [数字]字符串结果取 a=数字 b=字符串截取方法1： int a = ...
页面中加载优酷视频去掉广告的方法

1.优酷视频去广告代码： embed src=" http://static.youku.com/v1.0.0149/v/swf/...
Windows 10 21H1下发新版：解决资源管理

Windows 10 21H1已经面向Beta通道的Insider会员推送，最新版本号Build 19043.899...
嵌入式静态显示与动态显示

**嵌入式静态显示与动态显示** 首先LED显示器工作方式有两种静态显示方式和动态...
一文看懂：如何从源头防止数据隐私泄露

今天我们来讲一讲大家的隐私如何从源头得到保护一直以来我们生活在现实世界互...
WebGPU[4] 纹理三角形 - 秋意正寒

代码见： https://github.com/onsummer/my-dev-notes/tree/master/webgpu-Notes/...
Hibernate识别数据库特有字段实例详解

Hibernate识别数据库特有字段实例详解前言： Hibernate已经为绝大多数常用的数...
一口气说出4种 “附近的人” 实现方式，

引言昨天一位公众号粉丝和我讨论了一道面试题，个人觉得比较有意义，这里整理了...