【NIPS 2021】ASR-GLUE: A New Multi-task Benchmark for ASR-Robust Natural Language Understanding

原文链接：https://arxiv.org/abs/2108.13048
数据集：https://drive.google.com/drive/folders/1slqI6pUiab470vCxQBZemQZN-a_ssv1Q

intro

本文提出了ASR-GLUE benchmark，包含6个不同的NLU任务的新集合，用于评估3种不同背景噪声水平和6个不同母语者的ASR误差下模型的性能。并在噪声强度、误差类型和扬声器变量等方面系统地研究了ASR误差对NLU任务的影响。之后采用了两种方法：基于校正的方法和基于数据增强的方法来提高NLU系统的鲁棒性，但是仍远逊于人类识别能力。

method

ASR-GLUE流程如下：

首先筛选高质量的文本数据集，保留原始训练集，在测试集中随机选择一个样本子集进行每个任务的人类录音，并提供不同水平的环境噪声，并将音频信号发送到ASR系统中，得到最终的ASR的评估结果。

本文抽取的5个典型的NLU任务为：情感分类(SST-2)、语义文本相似性(STS-B)、转述(QQP2)、 QA NLI(QNLI)、识别文本隐含性(RTE)。并与科学NLI任务(SciTail)合并，总共完成6个任务。

左：BERT在不同噪声水平下在不同任务上的性能。阴影区域代表人的表现。
右：SST-2任务中不同模型架构的准确性结果。这里的“人类”表示人类在各种噪声设置下的表现。“清洁”表示对干净文本数据的测试。“低、中、高”分别代表低、中、高噪声的测试。
结论：发现各个模型对于ASR的错误敏感度很大，且噪声对准确率影响剧烈

ASR错误类型

作者将ASR的错误分为以下四种：

相似（Similar sounds）：当ASR系统时，有时也会出现错误地将一个单词识别为另一个发音相似的单词。
连接（Liaison）：单词之间产生了连读，或者识别后两个词融在了一起。
插入（Insertion）：ASR系统识别产生单词冗余
删除（Deletion）：ASR系统识别后产生单词遗漏

左：SST-2数据集中不同噪声设置下每种错误类型的百分比。
右：BERT在四个子集上的准确性。每个子集只包含具有一个特定错误类型的测试示例。例如，红色块表示BERT在包含相似声音错误（Similar sounds）的测试样本上的准确性。阴影区域表示由特定错误类型导致的性能下降

ASR speakers

测试中6个speaker的准确率差异性，WER越高，意味着测试样本中的ASR误差越大，导致错误分类越多。

ASR鲁棒性

上图提出的两种增加ASR鲁棒性的策略：ASR纠错和数据增强。

ASR纠错：在ASR输出后面加一个纠错模型，本文采用GETToR和BART来将ASR系统的输出转换为干净的文本。在训练中，该模型以ASR假设作为输入，以相应的干净转录文本作为输出。通过这种方法，模型学会了纠正假设中的错误，并将其恢复到一个干净的句子中。
ASR数据增强模型：
分为两种，音频级与文本级
1.音频级增强。 在音频级增强中，我们采用TTS系统将其中的文本形式的训练数据转换为音频文件。然后我们在音频中添加随机的环境噪声，并采用ASR系统将音频文件转换为ASR假设。在训练过程中，我们使用这些增强的数据作为额外的训练数据，以及原始的训练集来训练NLU模型。
2.文本级增强。 由于TTS和ASR系统的成本较高，我们进一步尝试通过文本生成模型或一些手动预定义的规则，将ASR错误注入到训练语料库中，生成错误的文本进行训练

实验

由上图可知，音频级增强整体效果最好，但在高噪声情况下效果很差。ASR输出纠错的方法整体较差，作者的解释是ASR系统已经集成了一个强大的n-gram语言模型，以保证系统输出的质量。因此，一个额外的语言模型是冗余的，不能进行进一步的改进。

个人分析：没有接触过ASR系统，但是感觉这篇对ASR的错误分类不像raddle那么细致系统，且它的第一种ASR纠错其实本质就是添加模型对asr输出文本纠错，且它的效果不好，感觉可以提升。同样文本级增强也是，也是添加噪声语料，对模型进行鲁棒性训练，复旦的平台也可以添加的更全面。

numpy中视图和副本的区别

副本(深拷贝)是一个数据的完整的拷贝，如果我们对其进行修改，它不会影响到原始数据，物理内存(id( ))不在同一位置。实现方式： Python 序列的切片操作;Python调用copy.d

[实战-04] 监控kafka一分钟没数据就报警

场景，正常来说几秒钟就会有数据过来，为了监控上游数据接口是不是有问题，可通过监控kafa数据在指定时间内是否有数据产生，没有数据则进行告警。本代码是伪代码，读者可自行修改成自己想要的。逻辑分析

Typescript的数据类型和Typescript的函数

TypeScript Typescript 介绍 TypeScript 是由微软开发的一款开源的编程语言。

有意

有意静谧的夜与往常一样没有星星向月光表白路灯下摇曳着的桐枝像是在嘲笑我的身影可惜不等它默默反驳主人却已经渐渐远去

drf\PageNumberPagination\django分页器，对特定的数据进行分页功能。

一、使用场景：在群查的时候，需要使用到我们的分页功能。但是有些时候，表中的数据很多，且我们需要的是表中指定的部分数据，而不是所有数据都需要查询。例如学生表，我们要查某个班级的所有学生，显示的时候要进行分页。这个时候我们的queryset=models.Us

javascript事件模型与事件监听器【知识总结】

一直想写一篇关于事件和监听器的文章，但又怕显得很多余，毕竟这不是什么新知识，而且网上的优秀文章已经很多了。总也有这样的感觉：这部分知识我似乎已经懂了，但有时候也会遇到些问题，虽然可以不求甚解的换个方法解决了问题，但总觉得不对劲，肯定还有哪些地方我没有理解到位。本着对前端工

java jar springboot_SpringBoot项目的jar包在服务器上启动的正确姿势

一般上来说，我们在服务器上启动一个jar，最简单的方式就是java -jar xx.jar，虽然这种方式简单但有时候我们的场景需要更多，例如常驻后台运行，在命令行窗口关闭的时候不中断项目，指定端口，并且输出日志到文件中等。所以这个时候我们通常会采用脚本启动和关闭项目，方便项目的统

利用AdaBoost元算法提高分类性能

一、元算法元算法是对其他算法进行组合的一种方式。我们自然可以将不同的分类器组合起来，而这种组合结果则被称为集成算法或者元算法。集成学习的结果通过投票法产生，即“少数服从多数”

Codeforces Round #112 (Div. 2) C Another Problem on Strings

codeforces上的很多题都需要好的想法才能做。 #include<iostream> #define maxn 10000005 using namespace std; int n,i,k,s[ma

java开源对象池_JAVA 对象池

GenericObjectPool利用一个org.apache.commons.collections.CursorableLinkedList对象来保存对象池里的对象。这种对象池的特色是：可以设定最多能从池中借出多少个对象。可以设定池中最多能保存

当先锋百科网