您所在的位置:首页  新闻动态
OLR2020 Challenge基线系统及ASV-Subtools开源工具发布

发布时间:2020-06-19 浏览次数:1992

OLR2020 Challenge基线系统及ASV-Subtools开源工具发布


    2020年东方语种识别竞赛(OLR2020 Challenge)中,为了让参赛者们更好地评估自己的系统,以及为初次参赛的参赛者提供可以快速复现的系统,厦门大学智能语音实验室(XMUSPEECH)提供了基于KaldiPytorch两个开源平台的基线系统:基于Kaldii-vector系统和x-vector系统,基于Pytorchx-vector系统。参赛者们可以通过以下网址进行参考和下载基线系统:https://github.com/Snowdar/asv-subtools#2-ap-olr-challenge-2020-baseline-recipe-language-identification


    OLR2020 Challenge基线系统可以帮助初次接触语种识别的参赛者快速搭建一套语种识别系统;另外,厦门大学智能语音实验室同时开源了ASV-Subtools工具,ASV-Subtools工具相比于其他开源工具的优势在于其整合了Pytorch的训练和Kaldi的前端后端处理,不仅可用在今年的语种识别竞赛,还可用于声纹识别系统的搭建。


    ASV-Subtools提供了完整的基于shell脚本的recipe供参赛者快速搭建一套语种识别系统或者复现OLR基线系统。在提供的run.sh这一个脚本中就可以实现基于i-vectorx-vector的语种识别系统搭建,得到符合竞赛要求的输出分数文件。


    如图1和图2所示,ASV-Subtools工具同时整合了Kaldi工具和Pytorch工具:使用Pytorch来训练模型,其余流程使用Kaldi处理。除了ASV-Subtools中提供的配置选项外,使用者也很容易在Pytorch上补充选项之外的需求,快速自定义神经网络,用于声纹识别模型的训练。


    关于ASV-Subtools的更多细节可以参考:https://github.com/Snowdar/asv-subtools



图1 ASV-Subtools的流程框架



图2 ASV-Subtools的工程结构