当前位置:主页 > 查看内容

语音识别天池新人赛

发布时间:2021-07-12 00:00| 位朋友查看

简介:数据集来自Eating Sound Collection数据集中包含20种不同食物的咀嚼声音赛题任务是给这些声音数据建模准确分类。作为零基础入门语音识别的新人赛本次任务不涉及复杂的声音模型、语言模型希望大家通过两种baseline的学习能体验到语音识别的乐趣。 train文件夹……

数据集来自Eating Sound Collection,数据集中包含20种不同食物的咀嚼声音,赛题任务是给这些声音数据建模,准确分类。作为零基础入门语音识别的新人赛,本次任务不涉及复杂的声音模型、语言模型,希望大家通过两种baseline的学习能体验到语音识别的乐趣。

train文件夹:完整的训练集;
train_sample文件夹:部分训练集;
test文件夹:测试集;
目前由于天池实验室存储限制,在DSW上参与本场比赛建议使用压缩后的数据集

赛题使用准确率(Accuracy)衡量选手结果与真实标签的差异性。

源码解读
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
建立字典与逆字典
在这里插入图片描述
遍历数据文件,计算梅尔频谱
在这里插入图片描述
搭建cnn网络
在这里插入图片描述
训练模型

在这里插入图片描述
预测测试集
在这里插入图片描述
提交结果

;原文链接:https://blog.csdn.net/qq_39822289/article/details/115712549
本站部分内容转载于网络,版权归原作者所有,转载之目的在于传播更多优秀技术内容,如有侵权请联系QQ/微信:153890879删除,谢谢!
上一篇:个人理解的比特币 下一篇:没有了

推荐图文


随机推荐