英語史関係のやや特殊なコーパス

コーパス言語学の可能性がどんどん広がっています。誰もが使用する大規模コーパスを見ることでわかることも多い一方、個性のある特殊なコーパスの利用もコトバの面白さを感じるきっかけになることがあります。

英語史研究関係で利用できるコーパスのいくつかを紹介してみます。

The Royal Society Corpus (RSC) 6.0 Open

The Royal Society Corpus (RSC) は、Philosophical Transactions of the Royal Society(1665年にHenry Oldenburg(Royal Societyの最初のセクレタリ)が創刊)をデータ化したしたコーパスです。最初期の科学英語のデータにアクセスできます。ダウンロードフォルダ版、ウェブ上で検索できるバージョンなど、いろいろ試してみてください。

The Salamanca Corpus: Digital Archive of English Dialect Texts

The Salamanca Corpus: Digital Archive of English Dialect Textsは、英語の方言に焦点を当てた史的コーパスで、継続的な更新により、データベースとしての価値も高まってきています。プロジェクトの立ち上げのときのサイトからURLが引っ越ししていますので、ご注意ください。

Corpus of English Chemistry Texts (CEChet)

オープンアクセス形式のコーパスで、1700年から1900年のchemistryに関するテキストを集積したコーパスです。University of A Coruña (Spain)がリリースしたデータベースです。詳細は、こちらから。

CHELAR: Corpus Of Historical English Law Reports 1535-1999, Version 1

2016年にリリースされた、法律文書の史的コーパスです。Universidad de Santiago de Compostelaの研究グループによる編纂で、編纂者の名前として、Paula Rodríguez-Puente, Teresa Fanego, María José López-Couso, Belén Méndez-Naya, Paloma Núñez-Pertejoが挙げられています。Modern English全般がデータ取得の対象となっています。詳細は、こちらから。

前の記事

保護中: 古英語の翻訳