英語の方言とコーパス

Freiburg English Dialect Corpus (FRED)

フライブルク大学は、現代英語を中心としたコーパス言語学の拠点的な役割を果たしてきました。この大学のプロジェクトとして作成されたコーパスでもっともよく知られているのが、FLOB (Freiburg LOB Corpus of British English), Frown (Freiburg Brown Corpus of American English)です。1960年代の英語を集積したLOB CorpusとBrown Corpusとパラレルな構造を持つ1990年代のコーパスで、20世紀後半の英語の変化を明らかにする目的でしばしば利用されます。現代英語を通時的に観察するという視点の定着させる役割も果たした重要なコーパスです。

ここで紹介するのは、同じフライブルク大学のプロジェクトですが、今度は共時的に現代英語の方言を集積したFreiburg English Dialect Corpus(あるいは、Freiburg Corpus of English Dialectsと呼ばれることもある)で、FREDとして親しまれているものです。FREDのページに記載の通り、コーパス編纂を指揮したのはProfessor Bernd Kortmannで、2000年~2005年に受けた研究助成金によりプロジェクトは遂行されました。

合計で約2.5 million wordsのコーパスですが、著作権の関係で、その使用には制限があります。ただし、FRED-S(sampler)の使用は多くの研究者に開かれているようです。

FREDを使用した研究の1例としては、Anderwald (2011)があります。英語方言における不規則変化動詞の過去形の揺れを扱った論文です。

引用文献

Anderwald, Lieselotte. 2011. “Norm vs Variation in British English Irregular Verbs: The Case of Past Tense Sang vs Sung“. English Language and Linguistics 15: 85-112.

The Salamanca Corpus: Digital Archive of English Dialect Texts

The Salamanca Corpus: Digital Archive of English Dialect Textsは、英語の方言に焦点を当てた史的コーパスで、継続的な更新により、データベースとしての価値も高まってきています。プロジェクトの立ち上げのときのサイトからURLが引っ越ししていますので、ご注意ください。