コーパス(Corpus)

コーパス(Corpus)の概念図

コーパス(Corpus)

目次

定義

コーパスとは、自然言語処理で用いられる、構造化された大規模な言語データ群のことである。AOCUMにおいては、AIにサイトの専門的文脈を正確に把握させるための核と定義しており、各記事をこの辞典と紐付けることで、サイト全体の知識ベースをAIフレンドリーな状態に保つ役割を果たす。

Q&A

Q: なぜコーパスが必要なのですか?
A: 用語辞典だけでは、汎用的な意味付けの辞典しかできません。コーパス辞典を実装することで、自分独自の定義の辞典を作ることができます。

参考文献 / References

国立国語研究所 『言語コーパスガイダンス』 / 国立国語研究所 [Link]

この記事を書いた人

「個人探究の生き方」を運営している ぼちぴ です。
どうしたら幸せになれるのか?という問いに対して「自立して個人探究をし、自分で掴みとる」という答えを得ることができました。
いまでは、「個人で探求する」ための実践法を中心に発信しています。
個人探究者、ぼちぴの経歴を詳しく見る