您好,欢迎访问栀旗实业官网!
全国咨询热线+15777576460
栀旗实业

新闻动态

NEWS CENTER
隧道反光环多少米一道,隧道反光环
发布时间:2024-04-18 15:57浏览次数:

链式模型实际上是一种序列判别训练方法,因此它还构造了分母fst和分子fst。从这张图中我们可以看到跳帧采样的现象。理论上,音素sil对应41帧(可以通过上一张phone打平图中sil对应的transition-id号得到),但现在是13帧(通过上一张图,1和218(都是1和218) 218对应音素sil),可以得到连续出现的次数)。

由于链式模型采用帧下采样(每三帧取一帧),也就是说帧移变为30ms,而不是10ms,因此帧率是传统神经网络声学模型的三分之一;链模型无需提前训练CE准则DNN模型;而是直接使用CD-HMM-GMM模型得到每个句子的比对结果,然后生成分子fst。



山东仿古候车亭多少钱



1、山东仿古候车亭多少钱

2.同时,为了将每个句子分成小块,链模型还会将分子格转换为分子fst(因为fst可以保留时间对齐信息,更容易根据时间将其分成块)。 lattice和fst的区别在于fst中编码了时间对齐信息,这可以方便我们根据时间点来分割整个音频片段。根据transition-id,我们可以得到每一帧对应的phone,如下:



收到讣告回复范文



2、收到讣告回复范文

这一步构建的训练图将在后面的分母fst和分子fst的构建中使用。链式模型的分母fst实际上是HCP(P代表发音词典的概率),也就是说所有音频共享同一个HCP图,不需要单独解码得到对应的格子,所以称为格子自由的。第三列和第四列是pdf-id(与输出相同,实际上是FSA)。



史蒂芬怪和亚历克斯有什么关系



3、史蒂芬怪和亚历克斯有什么关系

也许看完上图,你还有疑问,为什么pdf-id 218之间会有pdf-id 253呢?因为fst中有时间对齐信息,所以我们很容易将整个fst分成小块,如下图所示: 但是链模型的语言模型是phone级别的,所以我们不需要构图时的发音词典。其实结构就是HCP(P代表phone LM,HCP是fst结构,所以叫分母fst)。

链模型是在phone级别训练的,所以需要以phone为单位进行对齐,如下图所示:

在线客服
联系电话
全国免费咨询热线 +15777576460
  • · 专业的设计咨询
  • · 精准的解决方案
  • · 灵活的价格调整
  • · 1对1贴心服务
在线留言
回到顶部