语音信号处理-基本概念（一）：音频长度（s）、采样率（Hz；如16000）、帧长（25ms）、帧数、帧移（12.5ms）、hop_size（每帧移动的样本点数=16000*12.5/1000=200）

需要明白一点，mel帧数 * 帧移 = 音频长度（采样点个数，可换算为音频时长，具体怎么做不用说了吧）

因此，对于22050采样率， hopsize大小设置为256，那么对应的mel-spectrogram需要上采样 256倍

如果是16000采样率呢？使用帧长是50ms,帧移 12.5ms 那么hop_size就是200（16000*12.5/1000=200）啦，所以上采样倍数就是200倍啦.

一、采样率（采样频率）：每秒内进行采样的次数

每秒内进行采样的次数。符号是 fS，单位是 Hz。采样率越高，数字波形的形状就越接近原始模拟波形，声音的还原就越真实。

根据奈奎斯特·香农采样定理（Nyquist–Shannon sampling theorem），只有采样频率高于原始模拟信号中最高频率两倍，才能完美还原原信号。常用的采样率如下图所示

nb_samples表示一帧音频数据中采样的数量（次数），nb_sample

Apollo学习笔记作者：邹镇洪（清华大学车辆学院，个人

一Akka简单介绍

GAN简介 GAN思想是一种二人的零和博弈思想，GAN中有两个博弈者，一个生成器（G），一个判别器（D），这两个模型都有各自的输入和输出。具体功能如下：生成器（G）：输入一个随机噪声样本，通过

arcgis二次开发arcgis二次开发 Arcgis二次开发常用源代码 1.点上生成面的代码 if (m_pFeatureLayer.FeatureClass.ShapeType == esriGeometryType.esriGeom

前言本章介绍Ruby的File 类和方法及Dir 类和方法。 Ruby File 类和方法 File 表示一个连接到普通文件的 stdio 对象。open 为普通文件返回该

TP5中解决跨域的一种方案在 application->tags.php 文件中添加如下代码： 'app_init'

在不整合框架的情况下，使用jdbc从数据库读取数据时都得一个个的get和set，不仅累代码还显得不简洁，所以博主利用java的反射机制写了一个工具类，这样用jdbc从数据库拿数据的时候就不用那么麻烦了。因为很多情况下数据不止一条，所以返回的是对象类的一个集合。

Angular 简介虽然最近出了 Angular2，但是因为Angular2 依然是alpha版本，所以Angular1作为之前最火的前端框架依然有大量人在使用。 Angular 的特点：

Session Mode 会话模式先启动一个集群,保持一个会话,等待客户端提交作业.在集群其中的时候资源已经固定了,包含了多少个TaskManager多少个slot,提交的作业会在集群中进行资源的竞争.作业结束之后集群依然运行

python调用腾讯语音合成接口一、