n8nでGoogle Drive + Pinecone + GPT-4oを活用したRAGシステムの構築

n8nはノーコード/ローコードのワークフロー自動化ツールとして人気があります。本記事では、Google DriveとPineconeを活用し、企業の内部ドキュメントから情報を取得し、GPT-4oを用いて質問に回答するRAG(Retrieval-Augmented Generation)システムを構築する方法を紹介します。

近年、多くの企業がAIを活用して社内情報の管理や検索を効率化しています。従来のFAQシステムや検索エンジンでは、文書のキーワード検索に頼ることが多く、ユーザーが求める正確な回答を得るのが難しいケースがありました。しかし、RAGを用いることで、AIがリアルタイムで文書を検索し、より適切な回答を生成できるようになります。本記事では、その構築方法を詳細に説明していきます。

目次

今回のシステムの流れ

1.Google Driveに新しいファイルがアップロード/更新されると自動検出。

2.n8nがファイルをダウンロードし、テキストデータを抽出。

3.テキストを小さなチャンク(断片)に分割し、OpenAIのEmbeddings APIでベクトル化。

4.Pinecone(ベクトルデータベース)にベクトルデータを保存。

5.ユーザーが質問を入力すると、システムがPineconeから関連情報を取得。

6.GPT-4oが取得した情報を元に回答を生成し、ユーザーに返す。

この流れにより、最新の情報に基づいた回答を瞬時に提供できるようになります。

Google Driveのファイル取得とテキスト処理・ベクトル変換

Google Driveのファイル取得とテキスト処理・ベクトル変換
ノード 機能
Google Drive File Created新しいファイルが追加されたときにトリガー
Google Drive File Updated既存のファイルが更新されたときにトリガー
Download File From Google Driveファイルをダウンロード
Default Data Loaderバイナリデータをテキストデータに変換
Recursive Character Text Splitterテキストを小さなチャンクに分割し、AIによる処理を容易にする
Embeddings OpenAIOpenAIのAPIを使ってテキストをベクトル化し、高速検索を可能にする
Pinecone Vector StoreベクトルデータをPineconeに保存し、データベースとして機能

目的: Google Drive内のドキュメントを自動的に取得し、情報の最新性を保ちつつ、AIが理解しやすい形にベクトル化することで高速検索を可能にする

ユーザーの質問に回答するAIチャットボット

ユーザーの質問に回答するAIチャットボット
ノード機能
When chat message receivedユーザーの質問を受信し、ワークフローを開始
Pinecone Vector Store (Retrieval)Pineconeから関連情報を検索し、回答の基となるデータを取得
AI Agent (GPT-4o)取得した情報を元にAIが回答を生成し、ユーザーへ応答
Window Buffer Memory過去の会話を記憶し、コンテキストを維持することで自然なやり取りを実現

目的: ユーザーが入力した質問に対し、Pineconeから適切な情報を取得し、AIが適切な回答を提供する。

このプロセスを通じて、AIはただのチャットボットではなく、企業のナレッジベースを活用した高度なサポートエージェントとして機能します。

まとめ

企業のFAQシステムや社内ナレッジ管理、カスタマーサポートの自動化に活用できます。n8nとGoogle Drive、Pinecone、GPT-4oを組み合わせることで、強力なAIシステムを構築できます。

構築とかは必要でありましたらぜひ弊社に連絡してください。