EEBO = Early English Books Onlineの多様な形
EEBOは、1475-1700年にイギリスで出版された本集積した膨大なデータベースです。TCP = Text Creation Partnership の尽力により画像からの書きおこしが進み、現在 EEBO-TCP, Phase I と EEBO-TCP Phrase II が、検索可能な形で公開されています。EEBO本体にアクセスできない場合でも、異なるインターフェイスを通じて、EEBOの書きおこしにアクセスすることができ、大変貴重な資料を参照することが容易になりました。
公開は、以下のサイトで行われています。検索にあたっての一般的な注意点は、異綴り等が完全に整理されているわけではありませんので、レマ化や品詞タグによる検索は避けた方がよい点です。システム上可能な場合も、膨大な取りこぼしが起こります。単純な文字列検索が推奨されます。
- EEBO-TCP (University of Michigan) (Link to the Text Creation Partnership)(チュートリアル):単語の途中で行が切れている場合の処理がされていないので、検索で注意が必要になります。一方、コンテキストを見たり、テキストの情報を確認するのには、とても優れたインターフェイスだと感じます。
- Lancaster cqpweb(チュートリアル(YouTubeへのリンク)は検索画面の左下の方にあります):このサイトではさまざまなコーパスの検索が可能ですが、事前の登録が必要です。
- EarlyPrint Library (Northwestern University, Washington University in St. Louis): 多数の研究者の協働により、EEBO-TCPを分析に適した形で提供してくれるサイトです。
- EEBO, Mark Davies(Mark Daviesの YouTubeのチャンネルには、必ずしもEEBO Corpusについてのものではありませんが、コーパスの使い方全般についての説明もあります): コンコーダンスの形で検索結果が表示されますので、その後の処理がやりやすいです。言語分析には最適のインターフェイスです。一方で、コンテキストを確認したり、テキストについての情報を確認するのには若干不向きです。インターフェイス自体が異なる綴り字に対応していますが、上に書いているように、これを使用すると膨大な取りこぼしが起こりますので、文字列検索をお勧めします。なお、2022年8月現在、このサイトは、Phase I のみとなっています。