コーパス言語学
この記事は英語版の対応するページを翻訳することにより充実させることができます。(2024年11月) 翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
|
コーパス言語学(コーパスげんごがく、英: corpus linguistics)とは、言語学の一分野で、計算言語学と関連がある。
概要
編集実際に使用された言語資料の集成を『コーパス』と呼ぶが、最近では特に電子化された言語資料のことを指す。そのコーパスを利用して、より実際的な言語の仕組みを探る学問がコーパス言語学である。
チョムスキーの生成文法が言語能力[1]を調査対象とするのに対し、コーパス言語学は言語運用[2]に焦点を当てる。ある言語事象をリサーチクエスチョン(仮説)として設定し、それをコーパスデータに基づいて記述する。その後、その仮説を検証し、それに基づいて新たなリサーチクエスチョンを設定するという研究サイクルが一般的である。
コーパス言語学の発展によって、人間が使用する言語の殆どが「決まり文句の組み合わせである」ことが分かってきた[3]。
日本においては、日本語研究(日本語学)の分野においては、コーパスという名称を使わないものの、コンピュータ利用による言語資料の研究は、比較的早くから行われてきた。一方、ヨーロッパ系の言語研究分野において、コーパスという名前が使われるようになったのは、1980年代後半のことである。
日本における関連学会としては、計量国語学会(1956年設立)、英語コーパス学会(1993年設立)などがある。