概して、私たちが頼れる言語データには、三つの源がある。
一つは内省(introspection)である。
私たちの、直感的な言語能力に訴えるのである。
これは、長い間の言語学史上伝統的な手法であり、
ソシュールの、共有された知識としてのラングの概念の本質である。
近年の文法書や辞書は、この言語学者の内省に基づいている。
内省の手段としては、言語能力だけでなく、情報伝達の能力も必要である。
この方法では、
適切な言語使用を定義するしきたりは、
同じ直感的な出所から書かれるべきである。
しかし、このような直感的な標本抽出では疑わしいところもある。
二つ目の抽出方法は顕在化(elicitation)である。
これは情報提供者として、共同体の中の、他の人たちの直感を参考にする。
この時、情報提供者に、
特定言語要素の結合が、彼らの言葉では、文法的に在りうるのか、
特定の文脈で、どのような表現が適当であるかなどを、尋ねることになる。
内省と顕在化は、
言語の形式的な潜在力と、使用時に言語の機能する方法を築く。
どちらの場合も、データは抽象的な知識であり、現実の行為ではない。
人々の、自らが行っていることに関しての知識を明らかにするが、
実際に行っていることは、明らかに出来ない。
もし、能力よりも、言語運用に関するデータが欲しければ、
観察(observation)をしなければならない。
近年のコンピューター技術の発展で、大規模な観察が出来るようになった。
プログラムは、コーパス言語学(corpuc linguistics)において
書き言葉、話し言葉を含む、実際に生じた言語を収集し、分析する。
この分析は、内省や顕在化の直感的な入手ではない、
統語論的、文法的な頻度や発生の事実を明らかに出来る。
これがより信頼できるデータであると思われる。
確かに、コーパスは、不確定で矛盾をはらんだ直感に依存しているものよりも、
人々の実際の言語行動を明らかに出来る。
しかし、このような大規模な言語観察は、
既存の、直感や顕在化に基づく言語学の分野をすべて修正させるような、
使用の様相を明らかにする。
コーパス言語学は、実際の言語を扱う分野であり、
現実の言語の真実に接近する機能言語学と、近い存在である。
コーパスの分析は、言語使用と実際の言語行為のデータを明らかに出来る。
それは、安定しよく定義されたシステムに基づく、
言語のモデルを妥当性に疑問を投げかける。
コーパスが提供する、念入りな写生は、
形式言語学がの成果である、抽象的な絵とはまったく異なっている。
もし言語使用が、規則に支配された活動であるならば、
その規則を詳細に、見分けるのは難しい。
かつ、この詳細は、内省や顕在化では届かないところにある。
小規模なコーパスであっても、
言語の使用者本人が気付かない、発生の様式を発見することが出来る。
コーパス言語学は、直感的な知識を超えて、
価値が高くてもっともらしく、
根拠のない抽象化を矯正するものだと考えることが出来る。

PR