コーパス言語学

コーパス言語学（コーパスげんごがく、英: corpus linguistics）とは、言語学の一分野で、計算言語学と関連がある。

概要

実際に使用された言語資料の集成を『コーパス』と呼ぶが、最近では特に電子化された言語資料のことを指す。そのコーパスを利用して、より実際的な言語の仕組みを探る学問がコーパス言語学である。

チョムスキーの生成文法が言語能力^[1]を調査対象とするのに対し、コーパス言語学は言語運用^[2]に焦点を当てる。ある言語事象をリサーチクエスチョン（仮説）として設定し、それをコーパスデータに基づいて記述する。その後、その仮説を検証し、それに基づいて新たなリサーチクエスチョンを設定するという研究サイクルが一般的である。

コーパス言語学の発展によって、人間が使用する言語の殆どが「決まり文句の組み合わせである」ことが分かってきた^[3]。

日本においては、日本語研究（日本語学）の分野においては、コーパスという名称を使わないものの、コンピュータ利用による言語資料の研究は、比較的早くから行われてきた。一方、ヨーロッパ系の言語研究分野において、コーパスという名前が使われるようになったのは、1980年代後半のことである。

日本における関連学会としては、計量国語学会（1956年設立）、英語コーパス学会（1993年設立）などがある。

脚注

[脚注の使い方]

この項目は、言語学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（ウィキポータル言語学）。

この項目は、学問に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています。

[1] 英: competence

[2] 英: performance

[3] 池田和弘 (2016年7月23日). “多くの達人が実践している学習法 “暗唱”が最強の英語学習法である理由（1）”. 日経ビジネス (日経BP) 2016年7月31日閲覧。

[1]

[2]

[3]