コーパスを活用した現代ドイツ語の計量的研究へのいざない:現代ドイツ語はどのように変わってきているのか?【今道晴彦】

 私は現在コーパスを用いた現代ドイツ語の計量的研究に従事しています。コーパス(英corpus,独Korpus)とは言語研究用に収集されたコンピュータ上の言語データの集積のことで,データを手掛かりに,計量的観点から言語の特性を分析する学問分野はコーパス言語学(英corpus linguistics,独Korpuslinguistik)と呼ばれ,新しい言語分析の手法として近年注目されています。

 コーパス言語学に関心を抱くようになったのは,大学院博士後期課程の最終年度に当該分野で著名な石川慎一郎先生(神戸大学)の授業を受講して感銘を受けたことがきっかけです。私が参加した授業では,(1)言語データの収集・加工,(2)頻度情報の抽出,(3)種々の統計手法(検定,分散分析,多変量解析等)を用いた数値の評価を通して,計量的観点から言語を分析する手法を学びました。それまでメールやインターネット,文書作成以外にコンピュータを使った経験がなく,実例ではなく,作例に基づく言語分析に親しんできた私にとって,新たな言語事実の発見にも繋がる可能性を秘めた当該の分析手法は極めて斬新でした。授業は英語を対象としたもので,次第に自分の専攻するドイツ語の分析に応用してみたいという意欲が湧いてきました。他方で,当時は,国内はもとよりドイツ語圏においても統計手法を取り入れた研究が少なく,新たな分野に挑戦してみたいと思うようになりまして,大学院修了以降はコーパスを用いた現代ドイツ語の計量的研究に従事しています。

 現在私の研究室では長期的課題のひとつとして,過去数百年間のデータを収録するコーパスを用いて,現代ドイツ語における文章語の言語変化を可視化し,その実相を捉えることを目指しています。現在の文章語は,19世紀までのそれと比べて大きく異なると言われています。それは文章語の担い手を考えてみればわかることですが,19世紀までのドイツ語の文章語は,シラーやゲーテといった古典主義の文学作品によって方向付けられ,その主体は教養階級の人たちでした。しかし,その後,ドイツでは都市化が進み,文章語の中心的な担い手が教養層から都市の市民層へと移行します。また,自然主義文学の影響も手伝い,それまでの言語規範が崩れ始めます。具体的には,19世紀までの文章語は,名詞と動詞の調和が取れており,一文がやたらと長い文も珍しくありませんでした。しかし,都市の市民層には明確で簡潔な情報伝達が好まれ,その結果,文は句(名詞句)へと圧縮され,動詞よりも名詞が主体となる文体が急速に普及したと言われています。

 こうした現象は,単に名詞句の増加だけにとどまらず,たとえば,抽象名詞の増加,新語の増加,派生名詞の増加,機能動詞(語彙的意味を失い文法的機能しか有していない動詞)の増加,従属文(ドイツ語文法では副文),とくに関係文の増加等,言語の様々なレベルに及んでいると考えられます。しかし,実証的観点からこのことを追証した研究はなく,名詞文体が普及していくなかで,具体的にどのような言語変化が生じているのか,その変化はいつはじまり,いつまで続くのか,といった疑問が生じてきます。また,言語変化というものは,単一の現象の変化で完結するのではなく,それが引き金となって新たな変化が生じることもあり,どのような項目がどのような順序で変化しているのか,さらなる疑問も湧いてきます。こうした疑問は,とくに我々ドイツ語学習者が読み書きを学ぶ上でも重要な情報にもなり,ドイツ語教育への応用にも大いに期待されます。このことから,私の研究室では,統計手法を駆使して名詞文体の拡張の過程(の一端)を可視化し,その実相を明らかにすることを目指しています。高校生のみなさんにとって,おそらくドイツ語は未修の外国語になると思いますが,広島大学文学部で新たな言語の謎解きに挑んでみませんか?

図1 形容詞をつくる主な接尾辞の生産性とテキストジャンルとの関係

【使用コーパス】DWDSコーパス
【統計手法】コレスポンデンス分析
【引用元】筆者作成
【コメント】4つのテキストジャンル(学術書,新聞,映画字幕,ブログ)における主な接尾辞の生産性(エントロピー)を統計解析したところ,テキストのフォーマリティによる差が認められる。

接尾辞–lich(英–lyに相当)を取る低頻度の派生形容詞と時代区分との関係

図2 接尾辞–lich(英–lyに相当)を取る低頻度の派生形容詞と時代区分との関係

【使用コーパス】過去110年間の新聞記事
【統計手法】コレスポンデンス分析
【引用元】今道晴彦(2018)「現代ドイツ語の派生形容詞をつくる接尾辞–lichの通時的変化についてーコーパスに基づく計量的概観―」『統計数理研究所共同研究リポート』(統計数理研究所), 400, 31-44.
【コメント】1980年以降と以前の間に境界線を引くことができ,前者には多様化した現代社会を反映する形容詞が多く出現することが認められる。また,名詞文体で好んで使用される形容詞も多く,名詞文体の拡張と接尾辞–lichが関連している可能性が示唆される。


up