はてぶ・Qiita・Zennのトレンド記事を紹介
RAG(Retrieval-Augmented Generation)は、検索と生成AIを組み合わせた技術です。大量の情報から必要なデータを抽出し、AIが自然な文章を生成します。
gemini embedding 2 で "資料単位のナレッジ化" が容易に!?OCRできない見た目の知識をRAG化する 🔖 24
2026年3月、Google から gemini-embedding-2-preview が登場しました。これは テキスト・画像・動画・音声・PDF を単一の埋め込み空間にマッピングできる、マルチモーダル embedding モデルです。 これを見て、個人的にかなり大きいと感じた
RAGの文書検索でも「サブエージェント」を活用する手法 🔖 2
本記事では、RAGの性能を高めるための「SPD-RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ企業向けに開発しているスタートアップです。 この記事は何この記事は、RAGの精度を上げるための手
米国で話題のRAGのセキュリティ脅威についてまとめてみた 🔖 280
はじめに こんばんは、mirukyです。 前回の記事「コーディングが楽になったからこそ気をつけるべきセキュリティ」では、AIコーディング時代のセキュリティリスクについてまとめました。 今回は、あの記事の中では深く触れられなかったRAG(Retrieval-Augmented Ge
米国で話題のRAGのセキュリティ脅威についてまとめてみた 🔖 280
はじめにこんばんは、mirukyです。前回の記事「コーディングが楽になったからこそ気をつけるべきセキュリティ」では、AIコーディング時代のセキュリティリスクについてまとめました。今回は、あの記事の中では深く触れられなかったRAG(Retrieval-Augmente...
【Python+ローカルLLM】AIコーディングエージェントをRAGに組み合わせてみた 🔖 32
はじめに 「社内ドキュメントに自然言語で質問できたら便利じゃないか?」 「しかも、コードの書き方まで聞けたら最高じゃないか?」 そんな欲張りな発想から生まれたのが Django-RAG (Ver.2) です。 以前投稿した Agentic Coder の記事では、ローカルLLMで
BigQuery AI関数だけでRAGを構築する ― Embedding生成から類似検索まで 🔖 32
はじめに BigQuery の AI 関数(AI.EMBED・AI.SIMILARITY・VECTOR_SEARCH)を使えば、外部のベクトルDBや追加インフラなしで RAG(Retrieval-Augmented Generation)を構築できます。 以前は CREATE M
PDFをマルチモーダル画像解析してRAGの精度を検証 🔖 6
PDFのRAG(Retrieval-Augmented Generation:検索拡張生成)精度を上げるため、PDFをマルチモーダル画像解析する方法[1]を検証してみました。 準備RAGフレームワークLlamaIndexのTypeScript版と、OpenAIのgpt-5-
PDFをマルチモーダル画像解析してRAGの精度を検証 🔖 6
PDFのRAG(Retrieval-Augmented Generation:検索拡張生成)精度を上げるため、PDFをマルチモーダル画像解析する方法[1]を検証してみました。 準備RAGフレームワークLlamaIndexのTypeScript版と、OpenAIのgpt-5-
RAGで足りなくなったので Agentic Search を調べてみた 🔖 46
はじめに 「なんでそこにあるデータを見てくれないかなぁ(泣)」…RAGを自作した人なら、一度はこう思ったことがあるのではないでしょうか。 私自身、社内情報検索用のチャットボットをRAGで構築しましたが、回答精度がなかなか上がりませんでした。チャンクサイズを調整し、ハイブリッド検索
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの検索の結果をメモリに蓄積していき、次以降の検索を高速かつ、高精度に実現するための手法「GAM-RAG」について紹介します。https://arxiv.org/pdf/2603.01783 サマリー
GraphRAGを実際に構築して分かった「使うほど賢くなるAI」の仕組み 🔖 53
はじめに ─ 「AIに文書を読ませる」だけでは足りなかった 最近、「社内の文書をAIに読ませて質問に答えさせる」という仕組みを耳にする機会が増えました。いわゆる RAG(Retrieval Augmented Generation) です。 これ、確かに便利なんです。マニュアルや
Claude Code が RAG を捨てた理由 -「Agentic Search」という選択肢 🔖 94
先日、YouTube で公開された技術チャンネル The Pragmatic Engineer のインタビュー動画(2026年3月公開)を見ていて、興味深い話を耳にしました。ゲストは Claude Code の中心的な開発者である Boris Cherny 氏。動画全体では Cl
【RAG ベストプラクティス探索】Reranker用のモデル比較とコスト削減実験 🔖 2
はじめに: Reranker何使う?問題ELYZAで機械学習エンジニアのインターンをしている見目です。本記事では、RAG システムにおける Reranker のモデル選定の考え方と、LLM を用いた Reranker のコスト削減手法をご紹介します。Rerankerとは、E
社内規程RAGの精度を73.3% → 100%に改善した話 🔖 42
RAGの精度を73%から100%に引き上げた、実録・チャンキング戦略とデータ前処理の工夫
以前、MCPサーバーとしてRAGを構築する記事を書きました。 PostgreSQL + pgvector + multilingual-e5-large という構成で、MCP経由でベクトル検索できるRAGサーバーです。このMCP RAGサーバーは、気に入ってはいたのですが、Pos
CosenseのRAGをCloudflare AI Search (Auto Rag)を使って爆速で作ってみる 🔖 2
経緯自前でRAGを実装するとなると、それなりの工数や実装、環境構築が必要になります。今となっては、一昔前のような単純なキーワード検索は避けたい場面も多く、そうした場合に手っ取り早いのがエージェンティックサーチだと思います。つまり、MCPやツールコールによって外部データを検索し、
以前、MCPサーバーとしてRAGを構築する記事を書きました。https://zenn.dev/mkj/articles/30eeb69bf84b3fPostgreSQL + pgvector + multilingual-e5-large という構成で、MCP経由でベクトル検
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 🔖 40
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 この記事で得られること 政治・政策領域という特殊なドメインで、LLMを使ったテキスト分析をプロダクションに載せるまでの設計判断 「ドメインエキスパートの暗黙知」をシステムに変換するときに直
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 🔖 40
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮 この記事で得られること政治・政策領域という特殊なドメインで、LLMを使ったテキスト分析をプロダクションに載せるまでの設計判断「ドメインエキスパートの暗黙知」をシステムに変換すると
階層的 RAG (Hierarchical RAG) の実装 🔖 3
はじめにシンプルなベクトル検索から一歩踏み込んで、 階層的 RAG (Hierarchical RAG) を実装してみました。 ベクトル検索だけでは物足りないと感じる場合、精度向上の一つの選択肢になるはずです。今回 HHKB (Happy Hacking Keyboard)
階層的 RAG (Hierarchical RAG) の実装 🔖 3
はじめにシンプルなベクトル検索から一歩踏み込んで、 階層的 RAG (Hierarchical RAG) を実装してみました。 ベクトル検索だけでは物足りないと感じる場合、精度向上の一つの選択肢になるはずです。今回 HHKB (Happy Hacking Keyboard)
The Pragmatic Summit 2026 🔖 39
San Franciscoで開催されたThe Pragmatic Summit に参加してきた. Pragmatic Engineeringは元UberのEMのGergely Oroszによるエンジニアでは最も有名なニュースレターの一つ.毎週業界の流れやテクノロジー関連のニュース
最近盛り上がっている「RAG不要論」をご存知でしょうか。本記事では、RAG不要論を検証した論文について、ざっくり解説します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は
ABEMAのリアルタイム基盤紹介 | CyberAgent Developers Blog 🔖 64
システムアーキテクチャ ABEMAでは、リアルタイムプロトコルを各マイクロサービスで個別に実装するのではなく、WebSocket、SSE、Polling をサポートするリアルタイムゲートウェイを別途配置する方式を採用しています。これにより、各マイクロサービスはリアルタイム通信方式
【2026年版】日本語RAGのEmbeddingモデル、結局どれが最強なのか?6構成で2000問ベンチマークした 🔖 22
こんにちは、株式会社FP16の二宮です。最近 RAG(Retrieval-Augmented Generation)のEmbeddingモデル選びで悩んでいたので、6つの構成を2000問で比較ベンチマークしてみました。「ruri-v3って本当に最強?」「ハイブリッド検索って意
【2026年版】日本語RAGのEmbeddingモデル、結局どれが最強なのか?6構成で2000問ベンチマークした 🔖 22
こんにちは、株式会社FP16の二宮です。最近 RAG(Retrieval-Augmented Generation)のEmbeddingモデル選びで悩んでいたので、6つの構成を2000問で比較ベンチマークしてみました。「ruri-v3って本当に最強?」「ハイブリッド検索って意
生成 AI による仕様書作成とレビューの考え方 | CyberAgent Developers Blog 🔖 435
ジャンプTOON ソフトウェアエンジニアの國師 (@ronnnnn_jp) です。 この記事では、仕様書の作成・レビューに生成 AI を活用するための実践的なアプローチを紹介します。 目次 生成 AI による開発効率の変化 LLM の特徴と制約 コンテキスト情報の整備 手順や制約
なぜ、Claude Codeは、RAGを捨ててAgentic Searchを選んだのか? 🔖 359
ちょっと前のことですが、Claude Codeの開発者でありAnthropicのエンジニアでもあるBoris Cherny氏が、「初期のClaude CodeではRAG+ローカルベクターDBを使っていたが、最終的にAgentic Searchの方が圧倒的に良いと分かった」 という
人間は意図、AIは実装:Codexが導く「要件を伝えるだけ」のAI駆動開発ワークフロー | CyberAgent Developers Blog 🔖 219
はじめに 特に、OpenAIのCodexに代表される「大規模なコードコンテキストを理解するAIモデル」のポテンシャルを最大限に引き出すため、各フェーズで使用するプロンプト、AIの予想出力、そしてコンテキスト管理の方法を具体的に紹介します。 この記事で学べること Codex等のコー
もうレビューは読まなくていい ― Bright Data × RAGで"全レビュー読破AI"を作った話 🔖 2
はじめにAmazonで少し高めの買い物をするとき、多くの人がレビューを参考にすると思います。でも、人気商品だとレビューが 数百件〜数千件 あるのは当たり前。全部読むのは現実的に不可能です。結果として、こんな経験をしたことはないでしょうか。星の平均だけ見て買った...
【LLM】社内文書をセキュアに検索!OllamaとOpen WebUIで構築する完全無料・RAG環境 🔖 159
今回は、これらをDocker Composeひとつで一撃で立ち上げるハンズオン形式で紹介します。 アーキテクチャ概要 今回構築するスタックは以下の通りです。すべてDockerコンテナとして稼働します。 Ollama: Llama 3やPhi-3などの高性能LLMをローカルで動かす
RAGを丁寧に解説(無料で使えるGemini,Obsidianを活用して自分の秘書を作る)|takeshy 🔖 235
はじめに生成AI(ChatGPTやGeminiやClaude)の中でよく話題にされる技術はMCPとRAGです。MCPは前回記事に書いたのでそちらを参照してください。 「RAG」という言葉を聞いたことはありますか?単語自体ではなく意味で検索する仕組みのことです。 難しそうに聞こえる
RAGの精度は入力構造で決まる|なぜテキストChunkingでは限界に到達するのか 🔖 28
はじめに|RAGは検索以前に、もう壊れている 多くのRAGは、検索やEmbeddingの改善以前に、「入力データの時点で精度の上限が決まっている」。 にもかかわらず私たちは、検索精度・Rerank・評価指標ばかりに目を向けてきた。 だが実際には、RAGに渡されるドキュメントはすで
コンテキストエンジニアリングの歴史:RAGの過去から現在をたどる 🔖 27
こんにちは、Algomatic AXカンパニー所属の大塚です。 本日は、LLMアプリケーション開発に欠かせない技術となったRAG(Retrieval-Augmented Generation:検索拡張生成) について、その誕生から最新動向までを論文とともに振り返っていきたいと思い
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、多段階のRAGで最初に入力した質問の大事なキーワードを、忘れないようにする手法「ActiShade」について紹介します。https://arxiv.org/pdf/2601.07260複雑な質問に回答する際に
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、多段階のRAGで最初に入力した質問の大事なキーワードを、忘れないようにする手法「ActiShade」について紹介します。https://arxiv.org/pdf/2601.07260複雑な質問に回答する際に
【2026最新】BedrockでRAGとエージェント作って、Amplifyから呼ぼう! 維持費ほぼ無料!? 🔖 6
AWSの生成AIサービス、Amazon Bedrockを使った最も基本的な機能の最新ハンズオンです。Bedrockナレッジベース(RAG構築機能)Bedrockエージェント(AIエージェント構築機能)AgentCoreの登場で出番が少なくなったBedrock Ag...
Multilingual Vector Search における実践的な設計パターンLLM や RAG を実運用に組み込む中で、Multilingual Embedding は非常に便利な一方、実際に使ってみると見過ごせない問題に直面します。本記事では、多言語 Vec...
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの検索結果の順序による精度低下を防ぐ手法、Stable-RAGについて紹介します。https://arxiv.org/pdf/2601.02993RAGは、情報を検索しその内容をLLMに渡すことで、LL
RAGに疲れた人に捧げるClaude SkillsをAPI経由で使って簡単にRAGっぽいものを作る方法 🔖 4
はじめにClaude Skills (Agent Skills)の基本的な動作などには触れていませんSKILL.mdのすごい書き方みたいな話も書いてませんClaude CodeからしかSkillsを使ってない人、RAGの精度に困ってる人におすすめです本記事で紹介する
RAGの取りこぼしを減らすには? — Corrective RAG で検索ミスを“後から直す” 🔖 25
はじめに ルミナイR&Dチームの栗原です。 前回の記事では、Self-RAG を題材に、 Retrieve / Generate / Critique の三段構えで LLM 自身に「検索する?」「この回答どう?」を考えさせる仕組み Reflection Tokens( や
RAGの「業界特化」戦略(メルカリの成功例に学ぶ) 🔖 122
本記事では、RAGの精度を向上させるための「ドメイン特化埋め込みモデル」の手法について、ざっくり解説します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この記事は、メルカ
RAGの「業界特化」戦略(メルカリの成功例に学ぶ) 🔖 122
本記事では、RAGの精度を向上させるための「ドメイン特化埋め込みモデル」の手法について、ざっくり解説します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何この記事は、メ
RAGの「業界特化」戦略(メルカリの成功例に学ぶ) 🔖 122
本記事では、RAGの精度を向上させるための「ドメイン特化埋め込みモデル」の手法について、ざっくり解説します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何この記事は、メ
はじめに 昨今、さまざまな生成AIの技術が台頭してきて、筆者は日々キャッチアップに奮闘しています。 全然追いつけていませんが、、、 そこで今回は「RAG」について勉強した内容をまとめてみました。 生成AI初学者の方達の参考になれば幸いです。 RAG(検索拡張生成)とは? RAG(
[入門] Crawl4AI:LLM・RAG向けWebスクレイピングの始め方 🔖 18
Crawl4AIは、LLM(大規模言語モデル)やRAGシステムに特化したオープンソースのWebスクレイピングフレームワークです。従来のスクレイピングツールと異なり、AIが扱いやすいMarkdown形式での出力や、LLMを活用した構造化データ抽出に対応しています。本記事では、Cra
はじめに昨今、さまざまな生成AIの技術が台頭してきて、筆者は日々キャッチアップに奮闘しています。全然追いつけていませんが、、、そこで今回は「RAG」について勉強した内容をまとめてみました。生成AI初学者の方達の参考になれば幸いです。RAG(検索拡張生成)とは?...