本公开涉及用于罕见词语音辨识的大规模语言模型数据选择。背景技术:1、自动语音辨识(asr)系统已经从每个模型具有专用目的的多个模型演化到使用单个神经网络将音频波形(即,输入序列)直接映射到输出句子(即......