記述文法
この記事はカテゴライズされていないか、不十分です。 |
記述文法(きじゅつぶんぽう)は、「実際の表現はどうなっているか」を捉える文法であり、「明らかに普通は使わないだろう?」という表現も含めて、「文法的に正しいかどうか」に関わる文法である。
例えば「できる」の命令形「できろ」は、規範文法では誤であるが、記述文法においては正である。日本語処理のうち、形態素解析において重要視される[1]。
概論
編集具体的には、橋本進吉・岩淵悦太郎による動詞の活用形について[注 1]、いろいろな理由から批判が出たことに起因する。焦点としては、「文語動詞の四段活用動詞の語幹は子音末尾である」のに対し、文語文法で「h」音末尾の動詞が学校文法では「ワ行音末尾動詞(w 音末尾動詞)」とされたが、その説明が理論的整合性に欠けているという話であった。それが問題になった1970年代末には、まだ「漢字の使えるパソコン」は普及しておらず、インターネットなどもなかった時代なので、SNOBOLはあったものの「コーパスデータの分析」という計算言語学は未発達であったことから[3][4]、検証は困難であった。
その後、ワープロやパソコンの普及などにより、「かな漢字変換」の高精度化に対するニーズが高まったが、記述文法への興味は喚起されなかった[注 2]。その後、1990年に日本語の辞書引きツールが発売され、アスキーの VJE チームやアップルコンピュータ・ジャパンのことえりチームとも協業したが、いかんせん「かな漢字変換」とはいっても「ローマ字→かな→漢字かな交じり」というルートに沿っていたため記述文法の記述が複雑になり[注 3]、実装はされなかった。これには当時「不定長データと動的 GC を行なえるプログラミング言語が普及していなかった」という理由もある[注 4]。
技法
編集日本語の用言の活用は、基本的には簡単でありローマ字ベースで記述すれば C 言語などでも六百行程度のコードによって記述できる(ただし、かなとローマ字の対応関係が一意でないため、「あ」を「_a」、「ん」を「nn」などと記述しないと扱いが面倒になる)。これに対し、従来の文語文法や学校文法で用いられている「かなベース」の記述を行なうと、おおむね二千行から三千行単位の記述になるため、国文法学者の手に余る(とはいえ、職業的なプログラマにとっては大した量ではないのだが、プログラマの多くは国文法学に堪能ではない)。そこで、中間言語(PrologやLISPなど)を用いた仮想言語システムを導入することが考えられたが、文字列処理に特化されていなかった(SQLは有望であったが[5]、先頭一致の文字列検索に対応していなかった)ために、言語処理の分野では普及はしなかった。
その他
編集日本語の不規則活用動詞には、いわゆる「サ変(する)」「カ変(くる)」以外に、「いう(言う/云う/謂う)」や「いく(行く/征く/逝く)」があり、「乞う/請う」「問う」は文語の活用を遺しているということが検証されている。
脚注
編集注釈
編集出典
編集参考文献
編集- 著書
- 川本崇雄『日本語の源流』講談社〈講談社現代新書594〉、1980年10月。ISBN 406145594X。
- 城生佰太郎『言語学は科学である:「象ガ国会デ宿題ヲ忘レル」不思議への招待』情報センター出版局、1990年11月。ISBN 4795810826。
- 論文
関連文献
編集- 藤井文男「「言語学的経験論」 : 「文法」の概念に対する科学論的考察」『Artes liberales』第38巻、岩手大学人文社会科学部、1986年6月、51-70頁、CRID 1390572174618459648、doi:10.15113/00013695、ISSN 03854183。
- 定延利之「コミュニケーション研究からみた日本語の記述文法の未来」『日本語文法』第11巻第2号、日本語文法学会、2011年9月、3-16頁、CRID 1050294045371413632、hdl:20.500.14094/90001953、ISSN 13468057。