映画『サイダーハウス』の単語のまとめが終わりませんでした。別の話題を繰り上げます。単語については一日遅れます。
コーパスという言葉は私にとっていまいちわからない単語です。でも、国語辞典、Wikipediaなどを調べたらアッサリと解決しました。今までの調べ方が悪かっただけの話でした。用語を調べただけですが、かなり理解できました。今日はその記事を、そのまま引用します。以下の出典はWikipediaです。
****************
まず、コーパスについて:
「身体」を意味する ラテン語: corpus に由来する。複数形は ラテン語: corpora(コーポラ)。英語式複数形とした 英語: corpuses の使用も散見される。
大規模なコーパスの作成には、相当の費用と時間がかかる。使用する文章に関わる著作権など、法的問題が発生するためである。データ作成の手間はあるが、コンピュータ利用により、それ以前に比べ、かなりの労力軽減と多様な構造化が実現した。日本では国立国語研究所が一億語の収録を目指す「KOTONOHA計画」をすすめている。
構造化した言語データを「一般利用する」という観点からは、三省堂がウィズダム英和・和英辞典の用例を「用例コーパス」として、期間限定で無料公開している。
日本でコーパスを一般に広く知らしめたのは、英語学者の投野由紀夫である。2003年、NHK教育テレビジョン『100語でスタート!英会話』で、英語コーパスを教材に活用した放送授業を展開し、それまで専門家しか知らなかったコーパスを一般的な存在へ変えた。2009年には新シリーズとしてずばりコーパスをタイトルに入れた『コーパス100!で英会話』が放送されている。
大規模なコーパスの作成には、相当の費用と時間がかかる。使用する文章に関わる著作権など、法的問題が発生するためである。データ作成の手間はあるが、コンピュータ利用により、それ以前に比べ、かなりの労力軽減と多様な構造化が実現した。日本では国立国語研究所が一億語の収録を目指す「KOTONOHA計画」をすすめている。
構造化した言語データを「一般利用する」という観点からは、三省堂がウィズダム英和・和英辞典の用例を「用例コーパス」として、期間限定で無料公開している。
日本でコーパスを一般に広く知らしめたのは、英語学者の投野由紀夫である。2003年、NHK教育テレビジョン『100語でスタート!英会話』で、英語コーパスを教材に活用した放送授業を展開し、それまで専門家しか知らなかったコーパスを一般的な存在へ変えた。2009年には新シリーズとしてずばりコーパスをタイトルに入れた『コーパス100!で英会話』が放送されている。
****************
ついで、コーパス言語学について:
コーパス言語学(コーパスげんごがく、英: corpus linguistics)とは、言語学の一分野で、計算言語学と関連がある。
実際に使用された言語資料の集成を『コーパス』と呼ぶが、最近では特に電子化された言語資料のことを指す。そのコーパスを利用して、より実際的な言語の仕組みを探る学問がコーパス言語学である。
チョムスキーの生成文法が言語能力[1]を調査対象とするのに対し、コーパス言語学は言語運用[2]に焦点を当てる。ある言語事象をリサーチクエスチョン(仮説)として設定し、それをコーパスデータに基づいて記述する。その後、その仮説を検証し、それに基づいて新たなリサーチクエスチョンを設定するという研究サイクルが一般的である。
コーパス言語学の発展によって、人間が使用する言語の殆どが「決まり文句の組み合わせである」ことが分かってきた[3]。
日本においては、日本語研究(日本語学)の分野においては、コーパスという名称を使わないものの、コンピュータ利用による言語資料の研究は、比較的早くから行われてきた。一方、ヨーロッパ系の言語研究分野において、コーパスという名前が使われるようになったのは、1980年代後半のことである。
日本における関連学会としては、計量国語学会(1956年設立)、英語コーパス学会(1993年設立)などがある。
チョムスキーの生成文法が言語能力[1]を調査対象とするのに対し、コーパス言語学は言語運用[2]に焦点を当てる。ある言語事象をリサーチクエスチョン(仮説)として設定し、それをコーパスデータに基づいて記述する。その後、その仮説を検証し、それに基づいて新たなリサーチクエスチョンを設定するという研究サイクルが一般的である。
コーパス言語学の発展によって、人間が使用する言語の殆どが「決まり文句の組み合わせである」ことが分かってきた[3]。
日本においては、日本語研究(日本語学)の分野においては、コーパスという名称を使わないものの、コンピュータ利用による言語資料の研究は、比較的早くから行われてきた。一方、ヨーロッパ系の言語研究分野において、コーパスという名前が使われるようになったのは、1980年代後半のことである。
日本における関連学会としては、計量国語学会(1956年設立)、英語コーパス学会(1993年設立)などがある。
おかげでかなり理解が進みました。特に、下線部の、「コーパス言語学の発展によって、人間が使用する言語の殆どが「決まり文句の組み合わせである」ことが分かってきた」には興味を惹かれました。
****************
すべての用語が理解可能ではありませんし、まったく馴染みのない人名、用語もありますが、最低限の理解に必要な情報を得たと思います。読者の中には既にご存知の方も多かったかも知れませんが、私にはなじみのない言葉でした。
明日は『サイダーハウス』の単語です。