自然言語の解析などのために、文学作品、会話、新聞記事などの大量の文章を蓄積したテキストデータベースはどれか。なお、生の文章そのものを収集したもの、文法的情報を付加したもの、意味的情報を付加したものなど様々な形態がある。
ア | アーカイブズ |
イ | コーパス |
ウ | シソーラス |
エ | ハイパテキスト |
ア | × | アーカイブズとは、複数のファイルを圧縮して1つのファイルとしてまとめることである。 |
イ | ○ | コーパスとは、コンピュータによる検索が可能になっている大量の言語データのことである。 日本語や英語のような特定の言語、あるいは複数の言語での、テキストデータ・音声データの集まりである。 |
ウ | × | シソーラスとは、言葉を同義語や意味上の類似関係、包含関係などによって分類した辞書、あるいはデータベースのことである。 |
エ | × | ハイパテキストとは、複数の文書(テキスト)を相互に関連付け、結び付ける仕組みである。 |