Transformers with convolutional context for ASR

(1) 论文思路

将原来sinusoidal 的位置编码用卷积学到的输入表征所代替，相对于原来的绝对位置表征，这种相对位置的编码效果更有利于后面的transformer 去发现长距离的依赖关系（避免了浅层transformer层在位置信息方面的学习）。具体效果：在LIbrispeech 无LM模型条件下WER达到4.7%（clean)和12.9%(other).

(2) 模型结构

左边的结构为transformer 一个layer的组成：
右边的结构为加入context后整个transformer的组成： encoder端：K个2D 卷积+layernorm +relu 后再接一个2-D max pooling.
Decoder 端：每个transformer block 采用多个对encoder context 的多头注意力层，并对之前预测结果进行1d卷积，共N层。

输入为10ms with 25ms window 计算的80D log mel-filterbank coefficients +3 个基本频率特征
2 个 2D 卷积block：每个block包含两层卷积，kernel size 3, max-pooling kernel 2. 第一个block feature map 64, 第二层128; decoder 端1d卷积有三层，无max pooling 层。

第一行为论文的卷积context 的配置，第二行实验采用将decoder端的卷积context换成绝对位置编码，效果明显变差，并且两者的拼接（第三行）也并有带来任何提升；增加encoder layer层对提升效果至关重要，增加encoder decoder的relu层对模型效果也有提升，但是增加encoder与decoder 的multi head 数量对效果有一定负面影响。

在相同参数量的情况下，采用更宽的context size/ 更深的卷积层的效果是更好的。

增加encoder的层数可以让模型更关注声音内容，忽略一些噪音和环境声音，对模型的提升最明显。 decoder 层数的增加虽然提升有限，但还是有益处的。

通过与其他模型的结果对比可以发现，本文采用的模型在dev other 和 test other 两个数据集上相对于其他的no LM model分别有12% ， 16%的提升，说明convolutional transformer 这种配置更能学好speech data、环境噪声等特征之间的长距离依赖，从而更好地分辨。对于clean 的数据，还需要外部text建立的LM来进一步带来效果提升。

chatgpt赋能python：用Python计算n!

用Python计算n! 在数学中，阶乘是一个正整数的乘积，例如5!表示5x4x3x2x1，即120。Python是一种功能强大的编程语言，可以轻松地计算阶乘。什么是阶乘（n!）?

关于application.xml

prado框架中application.xml使用 1.简单使用关于application.xml： <paths>

angular.js自定义指令

angular.js最为强大的地方在于可以通过自定义指令来扩展html元素，这种思路与JSP的taglib类似，但在实现细节上更为自由，并且自定义指令也可以提供表单元素交互、数据绑定、事件处理功能。

java中的this关键字

当成员变量和局部变量重名时，可以采用this关键字来进行区分。 this 指所在函数所属对象的引用，通俗的将就是：那个对象调用了this所在的函数，this就代表那个对象 eg:

Fragment——startActivityForResult后onActivityResult无反应之问题总结

最近在做一个二维码扫描的模块，在Fragment中startActivityForResult开启需要返回结果的二维码扫描的Activity，扫描完成后，Fragment的onActivityResult没有任何反应。下面贴出来的是多次测试后的正确代码：

stm32 lwip 运行一段时间后发送速度变慢_无线路由器运行不畅？不妨试试几个小妙招...

在WiFi成为手机、平板电脑和笔记本电脑连接网络的必要工具的同时，无线路由器也成为了我们每家每户的必需品。然而与此同时，我们很多人产生了这样的烦恼：家里已经优化了网络带宽，可网速为什么就是特别慢呢？究竟是什么原因造成了无线网络信号差？有什么办法来改善这种情况呢？

pytest接口自动化测试框架 | pytest常用插件

视频来源：B站《冒死上传！pytest接口自动化测试框架（基础理论到项目实战及二次开发）教学视频【软件测试】》一边学习一边整理老师的课程内容及试验笔记，并与大家分享，侵权即删，谢谢支持！附上汇总贴：

详解ajax、axios、fetch的区别

Ajax 传统的ajax指的是XMLHttpRequest，最早出现的向后端发送请求的技术，隶属于原始的js中，核心使用XMLHttpReqyest对象，多个请求之间如果有先后关系的话，就会出现回调地狱。

《数据库系统概论》课程学习(5)——第五章数据库完整性

Apache Hudi初探(二)(与flink的结合)--flink写hudi的操作(JobManager端的提交操作)

背景在

当先锋百科网

Transformers with convolutional context for ASR

Transformers with convolutional context for ASR

(1) 论文思路

(2) 模型结构

(3) 实验结果