软件介绍
LABB-CAT免费版是一款可以在浏览器中使用的语言学研究工具。我们可以通过LABB-CAT存储各种面试成绩单,让你更好的做语言学研究。
La B- CAT免费版软件功能
和用于存储介质的记录簿。LaBB-CAT本质上是一个音频/视频记录的时间对齐副本的存储库。Transcriptor、Praat或ELAN(可用于创建文件以将抄本文本与音频/视频记录中的相应位置对齐)可用于制作时间对齐的抄本。然后,抄本被上传到la B- CAT,这允许存储关于发言者和抄本的附加信息。
抄本,Praat或者ELAN。
征求意见的任务
您还可以定义归纳任务,包括提示参与者阅读和提出问题让他们回答。
当参与者完成任务时(使用他们的浏览器或移动设备),他们的声音将被记录下来,并自动直接上传到LaBB-CAT。
自动注释
结合信号数据,正字法转录和一些第三方数据和工具,转录可以自动标记,例如。
词汇标签
在CELEX数据的帮助下,可以用更多的数据自动标注单词。
语音学
摘要
形态学
色彩
频率
也可以集成其他词典,包括CMU发音词典和有奖词典。
强制对齐
在HTK或WebMAUS的帮助下,可以将句子级别对齐的抄本强制对齐到单词和段落级别。
使用HTK强制对齐
统计层
la B- CAT数据库本身的词频数据可以直接计算出来,并对每个词进行标注。
词频层
语言学和字数统计(LIWC)可以用来比较语料库和参考语料库。
LIWC比较
结合CELEX的时间表信息和音节数,我们可以计算出不同领域的语速。
每分钟的音节数,行数和圈数。
斯坦福解析器
使用Stanford Parser,您可以为抄本生成一个可编辑的语法树。
跨语法组件的注释。
解析树表示
脚本
您可以用Python或Javascript编写脚本来执行任意计算和注释任务。
用于计算双重可变性指数的Python脚本
IBM Watson的人格洞察力
LaBB-CAT可以与IBM Watson的Personality Insights网络服务集成,用于分析成绩单的个性。
手动注释
例如,您可以手动添加注释。
主题标签
单个单词的文本标签
可以用Praat对时间点或时间间隔进行注释。
用Praat标记点。
恢复
笔记本和笔记准备好之后,就可以搜索符合一定标准的笔记本了(比如根据说话人的年龄/性别,笔记本所属的语料库等。).).
按属性过滤发言者
当演讲者被选中时,他们可以在不同的层中搜索他们的句子,以找到文本或正则表达式。
在“成人”主题中搜索“the”,然后在音素级别搜索以I,E,I或@开头的单词。
这将返回所选抄本中与查询匹配的所有语句的列表。
搜索结果
如有必要,该列表可以直接导出为csv文件,并附带相关的演讲者和注释信息,以便在Excel或r中进一步分析。
搜索结果
或者可以提取音频样本用于分析。
从结果中提取音频
或者可以使用EMU-webApp直接编辑语句注释和对齐。
使用EMU-webApp编辑手机校准。
如果该语句已被强制对齐,可以用Praat对目标段进行批处理。
使用Praat提取形状和其他声学指标的批处理。
批处理Praat可以包含您自己的自定义Praat脚本。
用于批处理搜索结果的自定义Praat脚本。
此外,点击搜索返回的句子会产生一个完整的发言人的文字记录,它将与相关句子一起放在屏幕的顶部。你可以点击抄本的任何部分,播放媒体的相应部分。
交互式脚本
直接从交互式转录页面播放媒体,显示其他注释层,提取这一行的音频,或者在Praat中打开相应的带注释的TextGrid。您可以添加、编辑或删除注释,并调整对齐方式。