WordPress のデータを使って簡単な RAG を実装する(1)

後者の質問文だけを生成 AI に渡した場合は、生成 AI を普通に使っているのと変わりません。例えば、ChatGPT に普通に質問したのと同じ答が返ってきます。一方、基本的には非公開情報である検索フェーズの検索結果も渡す事で、生成 AI が非公開情報も（語弊はあるかもしれませんが）「学習」した上で回答を返してくるというのが、RAG のコンセプトです。

今回の実装の構成要素

今回の実装で必要となる構成要素毎に説明していきます。なお、今回は検索フェーズではベクトル検索を使います。

埋め込みモデル

「検索フェーズ」の項で説明したとおり、一般的なベクトル検索を使った RAG の場合は、文章をベクトルに変換するための言語モデルが必要です。今回は、HaggingFace の Sentence Transformers を使います。

ただ、埋め込みモデルの選択肢は沢山ありすぎて正直どれを使ったら良いのか迷うところです。オープンソースのものもあれば、OpenAI のように企業が提供している有料のものもあります。この辺りは、いずれ別の記事でまとめられればと思います。

ベクトルデータベース

ベクトルデータベースは、オープンソースのものもあれば、商用サービスもありますが、今回は PostgreSQL の拡張機能である pgvector を使います。ベクトルデータベースも色々ありますが、pgvector 以外もいくつか挙げておきます。

他の形式のデータベースにベクトル検索の機能を持たせたもの
- Elasticsearch
- Amazon OpenSearch Service
- Redis
ベクトル検索に特化したもの
- Pinecone
- Qdrant

生成 AI

最後に生成フェーズで使う LLM です。これも色々選択肢がありますが、今回はオープンソースの Llama 3.1 を使います。ご存知の通りそれ以外にも沢山ありますが、ここでは触れません。

WordPress

WordPress の記事データをまずは取得する必要がありますが、今回はとりあえず WordPress の API を使った簡単なスクリプトで、記事を全てダウンロードして使う事にします。

本格的なシステムにするのであれば、WordPress の記事が追加・更新された時にベクトルデータベースを更新するような WordPress のプラグインを実装するか、定期的にバッチで WordPress の更新情報を取りに行くようにする等の対応が必要だと思います。

まとめ

今回、RAG の簡単な説明、及びWordPress に溜まっている記事を外部情報として使って簡単な RAG を実装する場合の構成要素と実装の方向性を示しました。

次回は、簡単な実装例を示す予定です。

September 20, 2024 - posted by 中の人（管理者）

← 前の投稿

WordPress のデータを使って簡単な RAG を実装する(2)

次の投稿 →

手を動かしてAPI取得の理解が深まった話

WordPress のデータを使って簡単な RAG を実装する(1)

（追記）成果物

やりたい事・背景

RAG の説明

基本的な構成

検索フェーズ

生成フェーズ

今回の実装の構成要素

埋め込みモデル

ベクトルデータベース

生成 AI

WordPress

まとめ

← 前の投稿

次の投稿 →

コメントを残す

最近の投稿

タグ

アーカイブ

2026年

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年