Omnilingual ASR - Meta推出的多语言语音识别框架

Omnilingual ASR是Meta推出的多语言语音识别框架,覆盖1600+语言,78%语言字符错误率低于10%。其70亿参数wav2vec 2.0编码器结合CTC与Transformer解码器,支持零样本转录未见语言,仅需少量示例即可适配新语种。模型开源,含350种低资源语言语料库,推动全球濒危语言数字化与语音技术普惠。Omnilingual ASR - Meta推出的多语言语音识别框架

>>展开阅读