はてぶ・Qiita・Zennのトレンド記事を紹介
RAG(Retrieval-Augmented Generation)は、検索と生成AIを組み合わせた技術です。大量の情報から必要なデータを抽出し、AIが自然な文章を生成します。
【簡単】NotebookLMでBacklogのRAG構築をするための方法 | DevelopersIO 🔖 95
こんにちは、リテールアプリ共創部の戸田駿太です。 今回は、Backlogのプロジェクト情報を活用してNotebookLMでRAGを構築する方法をご紹介します。 プロジェクト管理ツールであるBacklogには、過去の課題、Wiki、コメントなど貴重な情報が蓄積されていますが、それら
Mastra×RAG×構造化ストリーミングの開発事例 - 先生検索AIエージェントの詳細解説 🔖 3
先日、オンライン家庭教師マナリンクにて、「先生検索エージェントが先生を探してくれる機能」をリリースしました🎉まずは簡単なデモ動画をご覧ください⬇️※画面は開発時点のもの/検索結果は一例ですこの機能には以下のような特徴があります。AIのレスポンスが 1文字ずつ表示(スト
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は文書の前処理によって、LLMの回答精度を20%も引き上げることに成功したRAGの手法について紹介します。かなりシンプルな手法で、RAGの効果を簡単に体験できる方法となっているので、まだRAGを作ったことが無い方におす
もうRAGを自作しなくていい!Vertex AI Search のススメ 🔖 266
生成 AI を検索体験に組み込みたい──そう考えたとき、RAGをゼロから実装するのは意外と骨が折れます。 埋め込みモデルの選定や大量ドキュメントのベクトル化バッチ、スケーリングするベクトル DB の運用、生成モデルへ渡すコンテキストの最適化など、工程が多岐にわたり運用負荷も高くな
開発者のためのRAGシステムとベクトルデータベース実装ガイド(後編) 🔖 1
RAGシステムのサンプル実装アプリ前半で学んだRAGとベクトル検索の概念を、実際のコードでどう実現しているか解説します。ソースはGitHubで公開しています!https://github.com/SakakitaniJunya/sample-rag-app/blob/ma
AIに「分からない」と言わせるための「RAG」の手法 🔖 279
株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。本記事では、RAGシステムがより正直に、知らないことには「分からない」と言えるようにするための手法「DTA(Divide-Then-Align)」について、ざ
AIに「分からない」と言わせるための「RAG」の手法 🔖 279
株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。本記事では、RAGシステムがより正直に、知らないことには「分からない」と言えるようにするための手法「DTA(Divide-Then-Align)」について、ざ
RAG時代終了か?高精度・高速・軽量のローカルLLMを【unsloth + Gemma3】で高速FTする! 🔖 221
みなさんこんにちは。私は株式会社ulusageの、技術ブログ生成AIです。これからなるべく鮮度の高い情報や、ためになるようなTipsを展開していきます。よろしくお願いします。(AIによる自動記事生成…
RAG(検索拡張生成)を用いるLLMアプリにおける、セキュリティ視点での実装ガイドライン 🔖 169
はじめに こんにちは、GMO Flatt Security株式会社 セキュリティエンジニアの藤田(@fujitargz)です。 昨今のLLM(大規模言語モデル)の急速な進化にともない、LLMを活用したサービスが多数登場しています。しかし、業務改善・ビジネス活用を狙ってLLMを触っ
GoでLuaのユニットテストを書こう | CyberAgent Developers Blog 🔖 19
ABEMAの広告システムのバックエンド開発をしている黒崎 (@kuro_m88) です。 GoでLuaのユニットテストの実装を試みた事例をご紹介します。 GoでLuaのユニットテストを書くモチベーション 端的に言うとGoで書いているアプリケーションサーバでValkeyを使っており
はじめに 昨今、AI の進化により、様々な分野での応用が進んでいます。特に、自然言語処理(NLP)の分野では、RAG( Retrieval-Augmented Generation)が注目されています。RAG は、情報検索と生成を組み合わせた手法であり、特に大規模言語モデル(LL
RAGに「狩猟本能」を搭載して、答えにたどり着くまで検索 🔖 41
本記事では、RAGの性能を高めるための「InForage」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けに「社内データ検索サービス」を提供しているスタートアップです。 この記事は何 この記事は、RAGの新手法である「InForage」の
RAGに「狩猟本能」を搭載して、答えにたどり着くまで検索 🔖 41
本記事では、RAGの性能を高めるための「InForage」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けに「社内データ検索サービス」を提供しているスタートアップです。 この記事は何この記事は、RAGの新手法である「InForage
RAGに「狩猟本能」を搭載して、答えにたどり着くまで検索 🔖 41
本記事では、RAGの性能を高めるための「InForage」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けに「社内データ検索サービス」を提供しているスタートアップです。 この記事は何この記事は、RAGの新手法である「InForage
AIを根拠とした新聞写真懐疑論の真偽|dragoner 🔖 742
先日、朝日新聞フォトアーカイブのTwitterアカウントの写真ツイートが話題になった。国鉄房総東線(現JR外房線)列車内の床に散乱する大量のゴミという写真だ(以下ツイート)。 1968年 房総半島の東岸を南下する国鉄房総東線(現JR外房線)を走行中の急行列車内で回収される大量のご
【Android】BottomSheetDialogFragment で Jetpack Compose を活用する 🔖 1
こんにちは!アルダグラムでエンジニアをしている渡邊です!弊社で提供しているモバイルアプリ「KANNA」は、主に React Native で開発されていますが、一部の機能や画面では Kotlin と Jetpack Compose を積極的に採用しています。このようなハイブリッ
【Android】BottomSheetDialogFragment で Jetpack Compose を活用する 🔖 1
こんにちは!アルダグラムでエンジニアをしている渡邊です!弊社で提供しているモバイルアプリ「KANNA」は、主に React Native で開発されていますが、一部の機能や画面では Kotlin と Jetpack Compose を積極的に採用しています。このようなハイブリッ
既存のRAGの検索精度をそのまま引き上げる「RRA」 🔖 39
導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、RAGの文書の検索精度を既存のシステムに付け加える形で、精度を引き上げることのできるRRA(Rational Retrieval Acts)について紹介します。 サマリー RAGの検索は、Embeddingを用いた
既存のRAGの検索精度をそのまま引き上げる「RRA」 🔖 39
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの文書の検索精度を既存のシステムに付け加える形で、精度を引き上げることのできるRRA(Rational Retrieval Acts)について紹介します。https://arxiv.org/pdf/2505
既存のRAGの検索精度をそのまま引き上げる「RRA」 🔖 39
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGの文書の検索精度を既存のシステムに付け加える形で、精度を引き上げることのできるRRA(Rational Retrieval Acts)について紹介します。https://arxiv.org/pdf/2505
Cohere Embed 4で作る!パワポ資料に強いRAGシステム 🔖 2
近年話題のRAG(Retrieval-Augmented Generation)ですが、「社内資料」や「業務ドキュメント」としてよく使われる パワポ(PowerPoint)資料 に対しても応用できたら便利だと思いませんか?この記事では、「Cohere Embed 4」 + 「
GitHub Copilot RAG-Extension 🔖 22
こちらの GitHub Copilot RAG-Extensionを試してみたので備忘録です。 GitHub Copilot Extensions とは GitHub Copilot Extensionsとは端的に言うと、GitHub Copilot Chatのエージェントやスキ
ローカルRAGを手軽に構築できるMCPサーバーを作りました 🔖 324
はじめに 最近話題のMCP(Model Context Protocol)記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください(お約束)。 今回は、LLMの代表的なユースケースとも言えるRAG(Retr
ローカルRAGを手軽に構築できるMCPサーバーを作りました 🔖 324
はじめに最近話題のMCP(Model Context Protocol)記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください(お約束)。https://zenn.dev/mkj/articles/0
ローカルRAGを手軽に構築できるMCPサーバーを作りました 🔖 324
はじめに最近話題のMCP(Model Context Protocol)記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください(お約束)。https://zenn.dev/mkj/articles/0
「RAG x Deep検索」でRAGの回答精度を向上させる 🔖 48
本記事では、RAGの性能を高めるための「DualRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けに「社内データ検索サービス」を提供しているスタートアップです。 この記事は何 この記事は、RAGの新手法である「DualRAG」の論文
「RAG x Deep検索」でRAGの回答精度を向上させる 🔖 48
本記事では、RAGの性能を高めるための「DualRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けに「社内データ検索サービス」を提供しているスタートアップです。 この記事は何この記事は、RAGの新手法である「DualRAG」の
「RAG x Deep検索」でRAGの回答精度を向上させる 🔖 48
本記事では、RAGの性能を高めるための「DualRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けに「社内データ検索サービス」を提供しているスタートアップです。 この記事は何この記事は、RAGの新手法である「DualRAG」の
Active Storageで画像をパブリックにする方法 🔖 1
こんにちは!!GWに有休を使って長期休みにしておらず、普通に働いています...(休みたかった今回はActive Storageで画像をパブリックにする方法とどのように実装されているかについて記事にしました。前提としては以下です。Ruby : 3.4.XRails :
BedrockとStreamlitでメタデータによるドキュメントを絞るRAG検索 🔖 1
内容Amazon BedrockとStreamlitを使用したRAGシステムを構築します。既に検索したいドキュメントが分かっている場合、全てのドキュメントから検索するよりもドキュメントを絞った方が…
RAGで使用するPDFの前処理を検証(PDF→マークダウン形式) 🔖 134
内容 Amazon Bedrockを使用したRAGシステムを構築します。ベクトルDBに情報を保存する際、事前に適切な形へチャンク分割を行い、回答精度を高めたいと思います。下記の記事ではHTMLファイルの前処理の検証について記載しましたが、今回はPDFファイルの前処理について記載を
RAGで使用するPDFの前処理を検証(PDF→マークダウン形式) 🔖 134
内容Amazon Bedrockを使用したRAGシステムを構築します。ベクトルDBに情報を保存する際、事前に適切な形へチャンク分割を行い、回答精度を高めたいと思います。下記の記事ではHTMLファイ…
横浜市がRAG導入を検証 実証で分かった「できるコト」「苦手なコト」 🔖 29
NTT東日本神奈川事業部は2025年4月18日、横浜市が実施した生成AIに関する検索拡張生成(RAG)実証の成果を公表した。2024年11月から2025年3月にかけて横浜市が実施したもので、NTT東日本神奈川事業部が技術・運用面での支援した。 横浜市のRAG実証、もたらした成果は
BedrockのRAGチャットに「出典はどこ?」を追加 🔖 1
内容Amazon Bedrockのナレッジベースを活用し、RAG(Retrieval-Augmented Generation)システムを構築します。Streamlitを用いたチャットアプリケーシ…
本記事では、RAGの性能を高めるための「REBEL」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 この記事は、RAGの新手法である「REBEL」の論文[1]について、日本語で簡単
本記事では、RAGの性能を高めるための「REBEL」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何この記事は、RAGの新手法である「REBEL」の論文[1]について、日本語で
RAG精度向上を目指したCRAGコンペ上位解法の紹介 🔖 2
TL;DR RAGの精度を競うCRAG Comprehensive RAG Benchmark Challenge(CRAGコンペ)がKDDCUP 2024にて開催されました。 CRAGコンペの上位1-3位チームの解法を紹介します。 はじめに NTTドコモ クロステック開発部 鈴
Snowflake リソースの Terragrunt 管理方法を改めた話 🔖 2
はじめにこんにちは!シンプルフォームの山岸です。当社では2024年6月に Snowflake 導入を決定し、データ基盤を従来利用してきた Amazon Redshift から移行しました。検証着手当時、トライアルアカウントを開設して最初に取り組んだことは、IaC 管理方法を設
この記事は間違いが含まれている可能性があります。 もともと自社のドキュメントでは Meilisearch で日本語全文検索を実現していましたが、ドキュメントに質問できるようしたいと思い、簡単な RAG を作りたい!と思っていました。 色々調べたところなんとなくこんな感じでできそう
RAGの限界性 RAG、つまり検索強化生成(Retrieval-Augmented Generation)は、現在の大規模言語モデル分野における注目の方向性です。これは情報検索技術と生成モデルを組み合わせ、大規模モデルの知識の正確性、文脈理解、最新情報の活用などの課題を解決します
RAGを構築してもうまくいかない時にまず調べること:それはチャンク戦略だ! 🔖 1
こんにちは。D2Cのデータサイエンティスト(AIエンジニア)の須田です。「どのテーブルを使えばいいかわからない…」社内データ活用の現場でよく聞くそんな声に応えるため、自然言語で質問するだけで、社内データベースから必要な情報を探し、SQLまで生成してくれるAIツール「Kibi
RAGの限界性RAG、つまり検索強化生成(Retrieval-Augmented Generation)は、現在の大規模言語モデル分野における注目の方向性です。これは情報検索技術と生成モデルを組み合わせ、大規模モデルの知識の正確性、文脈理解、最新情報の活用などの課題を解決し
1. はじめに社内には大量のドキュメントが存在し、多くの社員が必要な情報を探すのに時間を浪費しているケースはありませんか?こうした問題を解決するために、大規模言語モデル(LLM) を活用して社内…
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、取得したドキュメントを圧縮することでLLMの生成速度を最大5倍高速化する手法「OSCAR」について紹介します。速度はもちろん、入力するデータ自体も小さくできるので費用も抑えることができるようになっています。htt
多くの企業が「RAGの精度が出ない問題」に悩む中、ガートナーが「次のアプローチ」を予言 🔖 35
ガートナージャパンは2025年4月10日、企業のAIモデル活用に関する見解を発表した。汎用(はんよう)大規模言語モデル(LLM)は言語処理能力の点で強力であるものの、特定のビジネス領域での文脈を必要とするタスクでは応答の正確性が低下する傾向にあると指摘。このため、「企業は2027
【RAG】文書をパラメータ化してLLMに直接注入する手法 🔖 41
本記事では、RAGの性能を高めるための「DyPRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 この記事は、RAGの新手法である「DyPRAG」の論文[1]について、日本語で
【RAG】文書をパラメータ化してLLMに直接注入する手法 🔖 41
本記事では、RAGの性能を高めるための「DyPRAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何この記事は、RAGの新手法である「DyPRAG」の論文[1]について、日本
Gemma 3 で RAG 機能付きの安全なローカル AI チャット環境を構築する 🔖 13
1. はじめに!ローカルで Gemma 3 を動かす方法だけ知りたい方は 6. セットアップ手順 へ。出典:https://developers.googleblog.com/ja/introducing-gemma3/近年、大規模言語モデル(以下 LLM)の進化は目