コンコーダンサ
コンコーダンサはテキスト分析に必須のツール
言語研究者の間ではおなじみのソフトですが、言語研究やその他の文献研究以外の用途ではあまり使われないものとして、コンコーダンサがあります。ある文字列を含むテキストを取り出してくれるソフトです。ワープロソフトに含まれている検索でも文字列を探すことはできますが、これだと順番に次の箇所に飛ぶことはできますが、「取り出す」ということできません。この違いが大きいです。
なお、コンコーダンスというのは昔から使用されている用語で、コンピュータの使用が一般化する前は、紙媒体で、本の形で出版されていました。ある文字列(と前後の一定のテキスト)を取り出して、リストにして印刷したものです。どのような単語がどのぐらいの頻度で、どのようなコンテキストで起こるかを一覧できるようになっています。ここで紹介するコンコーダンサは、これを自動的に作成してくれるソフトです。
AntConc
コンコーダンサは使用者が限定的であるということもあって、研究者が独自に作成したものを公開している場合も少なくありません。私もいくつか異なるコンコ―ダンサを使い分けていますが、早稲田大学のLaurence Anthony先生が作成したAntConcはとても使いやすく、世界の言語研究者の間で広く使用されているので、紹介したいと思います。
Anthony先生はYouTubeでもAntConcを紹介しておられますので、ダウンロードから使い方まで、YouTubeで学んでいただけるとよいかと思います。
AntConc (Laurence Anthony)先生のYouTubeは、こちらから ー AntConc 3.4.0
- Tutorial 1: Getting Started、Tutorial 2: Concordance Tool – Basic Features、Tutorial 3: Concordance Tool – Advanced Features、Tutorial 4: Concordance Plot Tool、Tutorial 5: File View Tool、Tutorial 6: Clusters Tool、Tutorial 7: N-Grams Tool、Tutorial 8: Collocates Tool、Tutorial 9: Word List Tool、Tutorial 10: Keyword List Tool、Tutorial 11: Working with tagged data
LancsBox
Lancaster大学のV. Brezina先生のものとで開発されたLancsBoxも最近ユーザー数が急増しているコンコーダンサの一つです。Brezina先生自身がLancsBoxの使用方法を丁寧に解説するワークショップ等も定期的に開催されています。テキスト分析に有用な統計処理のプログラムのいくつかを内蔵していますので、コンコーダンサ内でかなりの分析が可能になっています。