YOKUTO TECH BLOG

TechBlog

AI・リプレイス・ニアショア開発まで。札幌のシステム開発会社ヨクトのエンジニアが、現場で得た知見や技術トピックを発信します。

Dify超入門 ・ ぜんぶ無料ではじめる全10回 第 5 回

FAQボット完成
― ナレッジ接続と精度向上(出典表示)

いよいよ連載の目玉です。第4回で作ったナレッジを第2回のチャットボットに接続し、出典付きで自社資料から答える“社内FAQアシスタント”を完成させます。AIが間違えたときの備えにも触れます。

著者:株式会社ヨクト 技術チーム 公開日:2026.05.29 読了目安:約10分
#Dify#AI#RAG#FAQボット#出典表示

今回のゴール

第4回で、社内資料を読み込ませたナレッジ(“資料の検索エンジン”)ができました。でもまだ、ボットとはつながっていません。今回それを接続して、連載前半の目標である「出典付き社内FAQアシスタント」を完成させます。

💡 今回のゴール

  • 第4回のナレッジを、第2回のチャットボットに接続する
  • 回答に出典(引用)を表示し、根拠をたどれるようにする
  • 公開して、第3回で共有したURLを“自社資料から答える”状態にする

① ナレッジをボットに接続する

第2回で作ったチャットボット「社内案内アシスタント」を スタジオ から開きます。編集画面の左側に コンテキスト という欄があるので、その 追加 をクリック。参照する知識を選択 から、第4回で作った 「社内FAQサンプル.txt」 にチェックを入れ、追加 で確定します。

これだけで、コンテキスト欄にナレッジが表示され、ボットが質問のたびにこの資料を検索して答えるようになります。

チャットボットのオーケストレーション画面。コンテキスト欄に『社内FAQサンプル.txt(経済・転置)』が追加され、検索設定ボタンが有効になっている
▲ 図5-1 コンテキストにナレッジを追加した状態。これでボットが回答時に社内資料を参照します。

② 出典付きで答えさせる(引用と帰属)

第3回で機能パネルの 「引用と帰属」 をオンにしておいたのを覚えていますか?これがオンだと、回答の根拠になった資料(出典)が回答の下に表示されます。さっそく デバッグとプレビュー で試してみましょう。

「会議室の予約は何日前までにすればいいですか?」と聞くと――一般論ではなく、アップロードしたサンプルFAQの内容(「3営業日前まで」)に沿って答え、さらに 「引用:社内FAQサンプル.txt」 と出典が表示されました。これこそ“自社専用ボット”の姿です。

デバッグとプレビューで、会議室予約の質問に『3営業日前までに社内ポータルから』と回答し、下に『引用:社内FAQサンプル.txt』と出典が表示されている
▲ 図5-2 社内資料にもとづいた回答+出典(引用:社内FAQサンプル.txt)。根拠をその場でたどれるのがRAGの大きな利点です。

💡 ここまでで“連載の目玉”が完成

「自社の資料にもとづいて、出典付きで答えるFAQボット」――これが連載前半のゴールでした。あとは公開すれば、第3回で配ったURLがそのまま“自社専用FAQ”として使えます(後述)。

③ AIは“自信満々に間違える”ことがある

⚠️ 出典が付いても、AIの回答を鵜呑みにしない

生成AIは、もっともらしく、しかし間違った内容を自信たっぷりに答えることがあります(ハルシネーション=幻覚と呼ばれます)。ナレッジ(RAG)と出典表示は、根拠を資料に縛り、その場で裏取りできるようにすることでこのリスクを大きく減らしますが、ゼロにはできません(資料に書かれていないことを推測したり、古い資料を引いたりする可能性があります)。
重要な判断につながる回答は、表示された出典を開いて人が最終確認する運用にしましょう。第2回のプロンプトに入れた「わからないことは正直にわかりませんと答える」も、こうした暴走を抑える工夫のひとつです。

④ 精度を上げたいとき(検索設定とアップグレード)

もっと賢く探させたいときは、コンテキスト欄の 検索設定 を開きます。ここでは トップK(質問1回につき何個のチャンクを拾うか)や、Rerank(拾った候補の並べ替え)を調整できます。まずは既定のままで十分です。

検索設定のダイアログ。マルチパス検索の説明、RERANK設定、トップKのスライダー(4)が表示されている
▲ 図5-3 検索設定。トップK(拾うチャンク数)などを調整できます。今回の「経済的」ナレッジはキーワードで検索します。

💰 “意味で探す”精度がほしいとき=高品質へのアップグレード

第4回では、クレジットを使わない「経済的」(キーワード検索)でナレッジを作りました。「言い回しが違っても意味で探す」ベクトル検索や、キーワードと意味を組み合わせるハイブリッド検索+重み調整を使いたい場合は、ナレッジを「高品質」にアップグレードする必要があります(これらの設定は高品質モードでのみ出てきます)。ただし、(1) 資料の読み直しで埋め込みクレジットを消費し、(2) 一度高品質にすると経済的に戻せません。まずは経済的で精度を確かめ、物足りなければ少量の資料で高品質を試す、という順番がおすすめです。

⑤ 公開して完成 ― 共有URLが“自社専用”に

仕上げに 公開する更新を公開 を押します(第3回で学んだ「公開しないと反映されない」ですね)。これで、第3回で同僚に配ったWeb AppのURLが、今度は自社資料から出典付きで答えるようになりました。URLは変わらないので、再共有も不要です。連載前半の目標達成です!

⑥ クレジットの確認

恒例の確認です。設定モデルプロバイダークォータ を開きましょう。「経済的」ナレッジの検索自体はクレジットを消費しません。一方で、AIが回答を作る1回ごとにクレジットを使うのは今までどおりです(今回も軽い gpt-5-mini なので消費はわずか)。公開後は社員の質問でも減っていく点に注意しましょう。

まとめと次回予告

今回は、ナレッジをボットに接続し、出典付きで自社資料から答えるFAQアシスタントを完成させました。AIの誤答への備え(出典での裏取り)や、精度を上げたいときの選択肢(高品質アップグレード)もおさえました。これで連載前半の山場は越えました!

▶ 次回(第6回)
運用フェーズに入ります。実際の利用ログの見方と、間違った回答を「この質問にはこの回答」とその場で教え込む「アノテーション」で、ボットを“育てていく”方法を解説します。

この記事で参照した公式情報

※ 画面のメニュー名や設定項目は、Difyのアップデートで変わることがあります。本記事は公開時点の情報・実画面にもとづいています。回答内容はAIの生成のため毎回変わり、誤りを含む可能性があります。スクリーンショット内のワークスペース名(メールアドレス)は記事用に伏せています。

“自社専用AI”を本番品質で作りませんか?

「大量の社内文書で高精度なRAGを作りたい」「誤答対策やアクセス管理まで含めて安全に運用したい」――そんなときは、要件定義から運用までを完全内製で伴走する株式会社ヨクトにご相談ください。

AI開発について見る お問合せ