asr-USB迷|专注于互联网分享

asr

data_list: 主要为了存储数据集的标签文本。（st_cmds，thchs30）

general_function:

	包括：feature_extract.py:主要用来计算语谱图。features_extract.py: 该脚本用于提取语音特征，包括MFCC、FBANK以及语谱图特征； 该脚本是对标签数据进行处理；pinzhen.py:拼帧file_wav.py:此函数是为了提取语音的文件列表以及文件字典的脚本，为后续的文件处理做准备；dict.txt：1421+1（字典：拼音以及对应的字）file_dict.py:此函数是用作于加载字典里面的符号，用于声学模型的训练以及语言模型的训练；ctcDecoder_tf.py:用tf定义一个专门ctc解码的图和会话，就不会一直增加节点了，速度快了很多edit_distance.py:用于计算测试集的准确率。

model_language:

	包括：dic_pinyin.txt:163406+1（拼音字典：两个字拼音）language_model1.txt:6880+1（单个字）language_model2.txt:58648+1(两个字的词汇)

get_language_model.py：加载已经训练过的语言模型
get_pinyin.py：加载dic_pinyin.txt
##LanguageModel.py: 创建基于隐马尔可夫的语言模型
##LanguageModel2.py：隐马尔可夫语言模型（拼音到文字）
readdata.py：用于读取数据集（thchs30）
model_language_test.py （拼音转为汉字）
test.py

asr

data_list: 主要为了存储数据集的标签文本。（st_cmds，thchs30）

general_function:

	包括：feature_extract.py:主要用来计算语谱图。features_extract.py: 该脚本用于提取语音特征，包括MFCC、FBANK以及语谱图特征； 该脚本是对标签数据进行处理；pinzhen.py:拼帧file_wav.py:此函数是为了提取语音的文件列表以及文件字典的脚本，为后续的文件处理做准备；dict.txt：1421+1（字典：拼音以及对应的字）file_dict.py:此函数是用作于加载字典里面的符号，用于声学模型的训练以及语言模型的训练；ctcDecoder_tf.py:用tf定义一个专门ctc解码的图和会话，就不会一直增加节点了，速度快了很多edit_distance.py:用于计算测试集的准确率。

model_language:

	包括：dic_pinyin.txt:163406+1（拼音字典：两个字拼音）language_model1.txt:6880+1（单个字）language_model2.txt:58648+1(两个字的词汇)

USB迷 | 专注于互联网分享

asr

asr

asr

与本文相关的文章

评论列表 (0)