Demo Video No.2 Visual Response RAG

visual response RAG
visual response RAG
株式会社調和技研 編集部

この記事を書いた人

株式会社調和技研 編集部

(Chowa Giken Editorial Department)

調和技研に関する情報や様々な記事を発信する編集部です。

#RAG(Retrieval Augmented Generation) #マルチモーダルAI(テキスト+画像理解) #ドキュメント検索AI #LLMによる自然言語生成 #多言語生成AI #AI Chatbotシステム

What can this do?

「ビジュアルレスポンスRAG」は、マニュアルやドキュメントに含まれる画像とテキストをAIが理解し、質問に対して説明文と関連画像を組み合わせて回答できるRAG技術です。画像付きのドキュメントをAIが参照できるようにすることで、

  • 手順説明
  • 部品説明
  • 操作ガイド

といった内容を、文章だけでなく画像と一緒に提示できます。
ユーザーはチャット形式で質問するだけでAIが該当する手順や図解を探し出し、理解しやすい形で回答を生成します。
またLLMの多言語生成機能により、日本語のドキュメントを元にして多言語で回答することも可能なので、複数のマニュアルを用意する必要がありません。

Uses Case

  • 製品マニュアルサポート(自動車、機械製品、電子機器などの操作・メンテナンスガイド)
  • 海外人材への製造現場作業の支援(工程マニュアルや作業手順)
  • 教育・トレーニング支援(教材や技術資料)
  • 社内ナレッジ検索(規則、社内マニュアル、オンボーディング資料の検索)