語料庫

信息技术名词,大批量电子化自然语言样本所构成的集合

語料庫一詞在語言學上意指大量的文本,通常經過整理,具有既定格式與標記。

根據語料庫的特徵,可以分為單語語料庫、雙語語料庫、平行語料庫等,根據語料的來源,可以分為書面語語料庫、口語語料庫、作文語料庫、學習者語料庫、古文書語料庫等。[1]

語料庫列表

多語

英語

漢語

繁體中文

簡體中文

日語

研究機構

外部連結

參考文獻

  1. ^ 狐狸等間隔. 日语语料库超入门. 微信公眾平台. [2022-12-20]. (原始內容存檔於2022-12-20).