英語史関係のやや特殊なコーパス
コーパス言語学の可能性がどんどん広がっています。誰もが使用する大規模コーパスを見ることでわかることも多い一方、個性のある特殊なコーパスの利用もコトバの面白さを感じるきっかけになることがあります。
英語史研究関係で利用できるコーパスのいくつかを紹介してみます。
The Royal Society Corpus (RSC) 6.0 Open
The Royal Society Corpus (RSC) は、Philosophical Transactions of the Royal Society(1665年にHenry Oldenburg(Royal Societyの最初のセクレタリ)が創刊)をデータ化したしたコーパスです。最初期の科学英語のデータにアクセスできます。ダウンロードフォルダ版、ウェブ上で検索できるバージョンなど、いろいろ試してみてください。
Corpus of English Chemistry Texts (CEChet)
オープンアクセス形式のコーパスで、1700年から1900年のchemistryに関するテキストを集積したコーパスです。University of A Coruña (Spain)がリリースしたデータベースです。詳細は、こちらから。
CHELAR: Corpus Of Historical English Law Reports 1535-1999, Version 1
2016年にリリースされた、法律文書の史的コーパスです。Universidad de Santiago de Compostelaの研究グループによる編纂で、編纂者の名前として、Paula Rodríguez-Puente, Teresa Fanego, María José López-Couso, Belén Méndez-Naya, Paloma Núñez-Pertejoが挙げられています。Modern English全般がデータ取得の対象となっています。詳細は、こちらから。