はてぶ・Qiita・Zennのトレンド記事を紹介
RAG(Retrieval-Augmented Generation)は、検索と生成AIを組み合わせた技術です。大量の情報から必要なデータを抽出し、AIが自然な文章を生成します。
RAGプロダクトを支える、ベクトルDB構築以外の周辺Tips 🔖 52
こんにちは、松尾研究所 データサイエンティストの浮田です。この記事は、松尾研究所Advent Calendar 2025の記事です。RAG (Retrieval-Augmented Generation) と聞くと、「ベクトルDBを構築する」という話に意識が向きがちです。もちろ
RAGプロダクトを支える、ベクトルDB構築以外の周辺Tips 🔖 52
こんにちは、松尾研究所 データサイエンティストの浮田です。この記事は、松尾研究所Advent Calendar 2025の記事です。RAG (Retrieval-Augmented Generation) と聞くと、「ベクトルDBを構築する」という話に意識が向きがちです。もちろ
社内AIヘルプデスク RAG精度改善の軌跡 〜自動評価システムの構築とマネージドRAGへの移行〜 🔖 7
はじめに こんにちは。DeNA IT戦略部のtolinerです。このブログは以下のブログの続きです。前回の記事で解説した背景知識や一部の用語を前提として進めていくため、ぜひ先にこちらを一読してください。社内AIヘルプデスク 正答率80%達成 RAG精度改善の軌跡 | BLOG
問い合わせ対応自動化:ノーコード×RAGでつくるAIチャットの裏側 🔖 3
こんにちは。DS.INSIGHTのサービスサイトを担当しています、猪目です。「問い合わせ対応を自動化したい!」そんな課題から、私たちのプロジェクトは始まりました。本記事では、ノーコード×RAG (Re...
AWS Storage Gateway(S3 File Gateway)を利用して手軽にデータをS3へ保管してみた 🔖 1
はじめに 背景 オンプレミスファイルサーバーの共通課題 なぜ AWS Storage Gateway(S3 File Gateway) なのか 留意点 構成図 やってみた 1. 必要なセキュリティグループの作成 2. 必要なエンドポイントの作成 3. EC2の作成 アクティベーシ
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、ドキュメントをグループに分けてリランクを行う「GroupRank」という手法について紹介します。https://arxiv.org/pdf/2511.11653 サマリーRAGの重要な構成要素の一つがリラ
RAGをゼロから実装して仕組みを学ぶ【2025年版】 🔖 89
本記事では、RAGの基本的な仕組みを理解するために、Pythonを使ってゼロからRAGを実装する手順をざっくり解説します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この
発端の話業務でReactを用いた開発を担当することになり、Reactド初心者な私が試しに触ってみたところ、以下のようなコードでエラーになりました。jsxfunction Hello() { return ( <h1>HELLO</h1>
RAGをゼロから実装して仕組みを学ぶ【2025年版】 🔖 89
!今回は、「RAG初心者」に向けた内容です。(プロのみなさん、すみません)本記事では、RAGの基本的な仕組みを理解するために、Pythonを使ってゼロからRAGを実装する手順をざっくり解説します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、
RAGをゼロから実装して仕組みを学ぶ【2025年版】 🔖 89
!今回は、「RAG初心者」に向けた内容です。(プロのみなさん、すみません)本記事では、RAGの基本的な仕組みを理解するために、Pythonを使ってゼロからRAGを実装する手順をざっくり解説します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、検索結果を効率的にキャッシュすることで、Agentで利用するRAGの速度を高速化することのできる手法「RAGBoost」について紹介します。https://arxiv.org/pdf/2511.03475
Pythonで構築する全国市町村ナレッジグラフ: GraphRAGを用いた意味的地域検索への応用 🔖 36
PyCon mini 東海 2025で登壇した内容に関する資料です。 URL:https://tokai.pycon.jp/2025/ 内容: 全国1741市町村の統計データであるSSDSE(教育用標準データセット)と住民基本台帳人口移動データを用いた市町村間の人の流れを示す人口
RAGを活用してセキュリティチェックシートの回答作業を自動化した話 🔖 207
はじめに 今回は、RAG(Retrieval-Augmented Generation)を使ってセキュリティチェックシートへの回答を自動化した事例を紹介します。生成AI技術をどう業務に活かせるのか、実際のところどうだったのか、できるだけ具体的にお伝えできればと思います。 そもそも
RAGを活用してセキュリティチェックシートの回答作業を自動化した話 🔖 207
はじめに今回は、RAG(Retrieval-Augmented Generation)を使ってセキュリティチェックシートへの回答を自動化した事例を紹介します。生成AI技術をどう業務に活かせるのか、実際のところどうだったのか、できるだけ具体的にお伝えできればと思います。 そも
社内AIヘルプデスク 正答率80%達成 RAG精度改善の軌跡 | BLOG - DeNA Engineering 🔖 128
はじめに 皆さん、こんにちは。IT本部IT戦略部の部長の鳥越です。 私たちIT本部が全力で推進している「AIジャーニー」。 この取り組みは、単なるツールの導入ではなく、AIという新たなテクノロジーの力を活用して、私たち一人ひとりの働き方そのものを変革し、会社全体の未来を創っていく
社内AIヘルプデスク 正答率80%達成 RAG精度改善の軌跡 🔖 128
はじめに こんにちは。DeNA IT戦略部の森嶋です。DeNAは今、「AIオールイン」を掲げ、全社を挙げてAIという新たなテクノロジーの力を活用する「AIジャーニー」を歩み始めています。これは業務のあり方を根本から見つめ直し、会社全体の未来を創っていくための挑戦です。今回は、
RerankでRAGの検索精度はどう変わる?軽量日本語モデルで試してみた 🔖 1
背景私たちのチームでは、Retrieval Augmented Generation(RAG)を活用して、社内ナレッジをより効果的に活用する取り組みを進めています。ナレッジ情報をベクトル化し、ベクトル検索によって関連する情報を取得し、それをもとにLLMで回答を生成するという流れ
本記事では、RAGの性能を高めるための「DualCSE」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ企業向けに開発しているスタートアップです。 この記事は何 この記事は、日本語特有の「あいまいな婉曲表現
本記事では、RAGの性能を高めるための「DualCSE」という手法について、ざっくり理解します。株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ企業向けに開発しているスタートアップです。 この記事は何この記事は、日本語特有の「あいまいな婉曲
RAGでのデータ整形(改行・インデント)がLLMの回答精度に与える影響を検証した - $shibayu36->blog; 🔖 121
slack-explorer-mcpでは、該当メッセージのpermalink URLをレスポンスで返さずに、利用側のAI Agentで組み立ててもらっている。なぜなら、permalinkをメッセージごとに返してしまうとトークン消費量が非常に多くなってしまうからだ。permalin
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、ドキュメントの更新に強いRAGの手法「VersionRAG」を紹介します。https://arxiv.org/pdf/2510.08109 サマリーRAGは便利な手法ですが、文書のバージョンの変化が苦手で
三井住友銀、社内AIにRAG導入 「国内RAG活用事例で最大級」 🔖 39
三井住友フィナンシャルグループは10月6日、社内向けAIアシスタントツール「SMBC-GAI」に、RAG技術を活用し、約130万件のファイルを学習させた社内情報検索機能を搭載したと発表した。 三井住友銀行の従業員向けに導入し、グループ各社への展開を検討する。「国内企業のRAG活用
RAGの精度向上手法、がっつりまとめ【2025年】 🔖 439
この記事は何 ナレッジセンスでは、エンタープライズ向けにRAGサービスを提供しています。その中で「RAGは簡単に作れるけど、精度を上げるのは難しい」という課題に日々向き合っています。本記事は、2024~2025年に公開された研究や事例をもとに、RAGの回答精度を高める代表的なアプ
RAGの精度向上手法、がっつりまとめ【2025年】 🔖 439
この記事は何ナレッジセンスでは、エンタープライズ向けにRAGサービスを提供しています。その中で「RAGは簡単に作れるけど、精度を上げるのは難しい」という課題に日々向き合っています。本記事は、2024~2025年に公開された研究や事例をもとに、RAGの回答精度を高める代表的なアプ
RAGの精度向上手法、がっつりまとめ【2025年】 🔖 439
この記事は何ナレッジセンスでは、エンタープライズ向けにRAGサービスを提供しています。その中で「RAGは簡単に作れるけど、精度を上げるのは難しい」という課題に日々向き合っています。本記事は、2024~2025年に公開された研究や事例をもとに、RAGの回答精度を高める代表的なアプ
RAGにおけるハイブリッド検索対決! OpenSearch Serverless VS Aurora Serverless 🔖 36
はじめに こんにちは。データ分析エンジニアの木介です。 今回はAmazon Bedrock Knowledge BasesベクトルDB(検索エンジン)として利用できるものの比較を行っていきたいと思います。 前回はS3 VectorsとOpenSearch Serverlessの比
J-RAGBench:日本企業でRAGするときの落とし穴とは 🔖 189
はじめに はじめまして。株式会社neoAIの研究開発組織 (neoAI Research) の山本勇太です。 昨今、RAG(Retrieval-Augmented Generation)の実用化が急速に進展しています。RAGは、入力クエリをもとに検索器(Retriever)が文書
J-RAGBench:日本企業でRAGするときの落とし穴とは 🔖 189
はじめにはじめまして。株式会社neoAIの研究開発組織 (neoAI Research) の山本勇太です。昨今、RAG(Retrieval-Augmented Generation)の実用化が急速に進展しています。RAGは、入力クエリをもとに検索器(Retriever)が文書
ローカルLLMを使ってRAGシステムを組み最新の論文を追いやすくする試み 🔖 52
arXivには1日あたり全体では800件ほどの論文が投稿されます。Quantum Physicsカテゴリだけでも50~100件ほどです。これだけの量を自力で追うのは現実的ではないでしょう。そこで、投稿論文をLLMで要約してRAGのナレッジベースに蓄積し、全体の動向を把握しやすくす
RAGを30倍速くするMetaの新技術「REFRAG」 🔖 189
本記事では、RAGの性能を高めるための「REFRAG」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。 この記事は何 この記事は、RAGの回答を爆速にする手法「RE
RAGを30倍速くするMetaの新技術「REFRAG」 🔖 189
本記事では、RAGの性能を高めるための「REFRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。 この記事は何この記事は、RAGの回答を爆速にする手法「
RAGの精度が出ないのはなぜ? どうしたらいいですか? 🔖 21
RAGの精度が出ないのはなぜ? どうしたらいいですか?:生成AIお悩み相談室(2)(1/2 ページ) 生成AIへの取り組みでとてもよく聞かれるのは、「RAGの精度が出ない」という悩みです。今回は、よく見られるケースや考えられる原因、改善策について、非エンジニアの皆さんに分かるよう
導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、RAGで数値情報を正しく認識できるのかを調査した論文を紹介します。 サマリー RAGはユーザーの質問に対して、意味的な類似度から関連性の高い情報を検索して、ユーザーの質問に回答します。この意味的な類似度の検索がRA
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGで数値情報を正しく認識できるのかを調査した論文を紹介します。https://arxiv.org/pdf/2509.05691 サマリーRAGはユーザーの質問に対して、意味的な類似度から関連性の高い情
「ベクトルDB不要」なRAG手法「PageIndex」を解説 🔖 98
本記事では、RAGの性能を高めるための「PageIndex」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この記事は、RAGで「ベク
「ベクトルDB不要」なRAG手法「PageIndex」を解説 🔖 98
本記事では、RAGの性能を高めるための「PageIndex」という手法について、ざっくり理解します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何この記事は、RAGで「
RAGで「無関係な」文書をいれると性能が向上する理由を解明 🔖 264
導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、RAGの認知の階層を分析して、ハルシネーションを防ぐ手法「LFD」について紹介します。 サマリー 以前の我々のブログでLLMに無関係な文書を渡すことでRAGの性能が向上する、という突拍子もない論文を紹介したことがあ
RAGで「無関係な」文書をいれると性能が向上する理由を解明 🔖 264
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの認知の階層を分析して、ハルシネーションを防ぐ手法「LFD」について紹介します。https://arxiv.org/pdf/2508.19614 サマリー以前の我々のブログでLLMに無関係な文書を渡
LLMを活用してソースコードから目的の情報をRAGする | ドクセル 🔖 33
ソースコードから目的の情報を得ることは簡単ではありませんが、特定の手法を用いることで効率的に情報を取得できます。まず、ソースコードを関数やクラス単位に分割し、それを数値列に変換します。質問内容も数値列に変換して類似度を計算し、その結果をもとに回答を得る流れを説明します。また、LL
ゲームのように移動可能な3D世界をリアルタイム生成できるAI「Mirage 2」 🔖 65
「Mirage 2」はAI開発企業のDynamics Labが開発したAIモデルで、1枚の画像と説明文をもとに自由に移動可能な3D空間をリアルタイム生成できます。Dynamics LabはMirage 2を「AIネイティブゲームエンジン」や「世界生成エンジン」と呼んでおり、将来的
RAGの精度評価・分析観点チェックリスト(自動生成) 🔖 1
LLM-RAGシステム精度分析チェックリストLLM-RAGシステムのアウトプット精度が期待値に満たない場合の原因分析を行うためのチェックリストです。問題を①データ、②プロンプト、③RAG、④LLMの4つの要素に切り分け、MECE(モレなくダブりなく)を意識して各観点を網羅的にリ
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの出力がどの情報源を元に出力したかを示す出典を、トークン出力確率を用いて判定する手法「LoDIT」について紹介します。https://arxiv.org/pdf/2508.08942 サマリーRIG
RAGの効果を見える化する評価のために - KPIの選び方 🔖 1
RAGの効果を曖昧にしないKPIの選び方と設計ステップを解説。ビジネス効率化や顧客満足度向上に向けた具体的手法を学べます。
脱StorageGateway乱立、StorageGateway共通利用のポイントまとめ 🔖 1
こんにちは!大和総研の河野です!本記事は、「2025 Japan AWS Jr. Champions夏のQiitaリレー」44日目の記事となります!今までの投稿はこちらのリンクにまとまっているのでぜひ他の記事も読んでいただければと思います。今回はStorage...
Amazon S3 Vectors を使って PDF ファイルで シンプルな RAG を構築 🔖 1
はじめに2025年7月15日、Amazon S3 Vectors のプレビュー版がリリースされました。本記事では、Amazon S3 のベクトルバケットとベクトルインデックスの作成や、登録したデータセットに対してベクトル検索を行い LLM で回答を生成する RAG アプ...
RAGは「幻滅期」突入、AIエージェントは「過度な期待」 Gartner、ハイプサイクルレポートを発表 🔖 40
ガートナージャパン(以下、Gartner)は2025年8月5日、「日本におけるクラウドとAIのハイプ・サイクル:2025年」を発表した。同レポートはクラウドとAIを中核とする34の注目テクノロジーを、AIと産業構造の変革、クラウドの進化、既存システムからのマイグレーションという3
「RAG」の将来について。「GPT-5」開発者の発言から 🔖 134
株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 本記事では、OpenAI開発者への最新インタビューから、今後のRAG動向を予想します。 本記事で参考にしているインタビューは、こ