[竞赛召集] 第四届东方语种识别竞赛(OLR 2019 Challenge)
由清华大学、厦门大学、昆山杜克大学、西北工业大学、海天瑞声公司联合举办的第四届东方语种识别竞赛(OLR 2019 Challenge)正如火如荼进行中,欢迎学术界和产业界的同仁们报名参加!
“东方语种识别竞赛”旨在加强语种识别研究的交流、促进东方语种识别技术的发展。自2016年第一届活动以来,每届保持数十家参赛队伍并逐年增多,更加实用、高效的语种识别技术在竞赛中得到打磨,学术界与产业界在语种识别技术的研发和应用联系愈加紧密。本届竞赛将从真实场景和实际应用出发,新增了更具挑战性、更加务实的任务,期待业内同仁们能在这些任务上相互切磋、共同进步。
任务设置
1、短语音语种识别:该任务所要识别的语音时长仅为1秒。
2、跨信道语种识别:该任务测试集与训练集的信道不同,如录音设备、场景的不同。
3、低资源语种识别:该任务所要识别的语种不包含在训练集当中,识别时针对每种语言仅提供数条语音作为参考。
数据信息
1、海天瑞声免费提供7种东方语种的语音数据,包括:粤语/国语/印尼语/日语/俄语/韩语/越南语。此外,海天瑞声还提供了6种其他语种数据,用于低资源语种识别任务。
2、清华大学免费提供3种东方语种的语音数据,包括哈萨克语/藏语/维吾尔语,这些语料来自清华大学、西北民族大学、新疆大学所共同承担的国家自然科学基金重点项目(M2ASR)。此外,清华大学提供完整的基准线脚本,以帮助参赛团队快速搭建系统。
3、本届比赛的开发集和测试集由清华大学和海天瑞声共同提供。
时间安排
2019年07月16日:训练集 / 开发集发布。
2019年10月01日:关闭注册。
2019年10月20日:测试集发布。
2019年11月01日:结果提交。
2019年11月18日:结果公示。
主办单位
清华大学 / 厦门大学 / 昆山杜克大学 / 西北工业大学 / 北京海天瑞声科技股份有限公司
报名方式
请发送邮件至 olr19@cslt.org 进行咨询或报名,报名时请提供以下信息:
- 团队名称:
- 机构名称:
- 参赛人员:
- 负责人:
- 通讯邮件:
- 个人主页/机构主页(要求参赛队伍从事语音相关研发工作):
结果公示
排名结果将于2019年11月在兰州举办的 APSIPA ASC 2019 会议上公布。会议官方 http://apsipa2019.org
更多信息
1、竞赛报名流程、数据协议、相关论文请参见官网 http://olr.cslt.org
2、NSFC 项目“多少数民族语言连续语音识别方法及应用(M2ASR)”请参见官网 http://m2asr.cslt.org
(转载自微信公众号:清语赋)