语料库

信息技术名词,大批量电子化自然语言样本所构成的集合

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。

根据语料库的特征,可以分为单语语料库、双语语料库、平行语料库等,根据语料的来源,可以分为书面语语料库、口语语料库、作文语料库、学习者语料库、古文书语料库等。[1]

语料库列表

多语

英语

汉语

繁体中文

简体中文

日语

研究机构

外部链接

参考文献

  1. ^ 狐狸等间隔. 日语语料库超入门. 微信公众平台. [2022-12-20]. (原始内容存档于2022-12-20).