はてぶ・Qiita・Zennのトレンド記事を紹介
LLM(大規模言語モデル)は、大量のテキストデータを学習したAIモデルです。ChatGPTなどの自然言語処理AIの基盤となっています。
LLMを使ってモバイルアプリのUITestを自動化してみたい 🔖 1
はじめに はじめまして。JCBデジタルソリューション開発部の若林です。MyJCBアプリのiOSエンジニアをしています。 今回は、モバイルアプリのUIテスト自動化ツール Maestro と LLMを組み合わせて、 「自然言語で書いた指示から、Maestroの操作コマンド(YAML)
「AI臭い文章を生成させない」ルール集。LLMに“質の高い技術文書”を書かせるスキルを技術書出版社表が公開(生成AIクローズアップ) | テクノエッジ TechnoEdge 🔖 942
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、LLM(大規模言語モデル)に日本語の技術文書を書かせたり推敲させたりするためのAI向けの日本語
月 100万件・ 50億トークンをローカルLLMで捌く - 明細名のストア情報マッピング 🔖 50
こんにちは。ナウキャストの Data Holder Unit 所属、マッピングチームでデータエンジニアをしている翁長です。 この記事では、2026 年度の社内 AI コンテストで優勝とテクノロジー賞をダブル受賞(!)した「ローカル LLM を活用したストアブランドマッピング」の取
LLM・AIエージェントシステムベストプラクティス | 翔泳社 🔖 46
著者の経験知の集大成! LLMやAIエージェントを使った本番システムの 設計・導入・運用・管理で 苦しんだ末に練り出した 39のベストプラクティスを あますところなく公開 【本書の背景】 大規模言語モデル(LLM)やAIエージェントは、企業や組織における業務効率化、顧客対応、知識
LLMの自由度を設計する:本番AIエージェントのコスト・再現性・観測性 🔖 23
初めまして!ナウキャストのよーたです。 データ&AIソリューション事業部にてAI Full-Cycle Engineerという職種でAIエージェントの開発やデータ基盤の整備を行っています。 はじめに PoCで動くエージェントと、数千件・数万件の業務データを安定して処理し、
AntigravityとローカルLLMをMCPで繋ぐ!完全無料でクオータを99%削減する連携術 🔖 160
はじめに 生成AIをヘビーに使い倒す開発者や学習者にとって、最大の敵は「APIクオータ(利用制限)の枯渇」ではないでしょうか。 私はAIアシスタント「Antigravity(Gemini)」の優秀な対話UI(特に出力に対してピンポイントでコメントできる機能)が大好きで、思考整理や
LLMの自由度を設計する:本番AIエージェントのコスト・再現性・観測性 🔖 23
初めまして!ナウキャストのよーたです。データ&AIソリューション事業部にてAI Full-Cycle Engineerという職種でAIエージェントの開発やデータ基盤の整備を行っています。 はじめにPoCで動くエージェントと、数千件・数万件の業務データを安定して処理
AntigravityとローカルLLMをMCPで繋ぐ!完全無料でクオータを99%削減する連携術 🔖 25
はじめに 生成AIをヘビーに使い倒す開発者や学習者にとって、最大の敵は「APIクオータ(利用制限)の枯渇」ではないでしょうか。 私はAIアシスタント「Antigravity(Gemini)」の優秀な対話UI(特に出力に対してピンポイントでコメントできる機能)が大好きで、思考整理や
TL;DR 「ローカルLLM=コストが安い」はほとんどの場合で誤りです。2026年時点での損益分岐点はかなり高く、GPUを遊ばせると単価はAPIより高くつきます。 それでもローカルLLMが勝つ領域はあります。ガバナンス・タスク特化での精度・レイテンシ の3軸です。 実例として、R
対話システムの評価を LLM にどこまで任せられるか(前編):5 つの落とし穴 🔖 46
TL;DR 対話システムを「エンドユーザーが使えるか」の観点で受け入れテストするとき、シナリオ生成も評価も LLM に任せたくなります。 しかし、LLM によるシミュレーション/評価には、生成発話のクオリティ、LLM as a Judge の限界、LLMベースシミュレーターの持つ
対話システムの評価を LLM にどこまで任せられるか(前編):5 つの落とし穴 🔖 46
TL;DR対話システムを「エンドユーザーが使えるか」の観点で受け入れテストするとき、シナリオ生成も評価も LLM に任せたくなります。しかし、LLM によるシミュレーション/評価には、生成発話のクオリティ、LLM as a Judge の限界、LLMベースシミュレーターの持
TL;DR「ローカルLLM=コストが安い」はほとんどの場合で誤りです。2026年時点での損益分岐点はかなり高く、GPUを遊ばせると単価はAPIより高くつきます。それでもローカルLLMが勝つ領域はあります。ガバナンス・タスク特化での精度・レイテンシ の3軸です。実例として、
TL;DR「ローカルLLM=コストが安い」はほとんどの場合で誤りです。2026年時点での損益分岐点はかなり高く、GPUを遊ばせると単価はAPIより高くつきます。それでもローカルLLMが勝つ領域はあります。ガバナンス・タスク特化での精度・レイテンシ の3軸です。実例として、
AIのLLMアーキテクチャの新技法「KV共有」「mHC」「圧縮アテンション」とは何か? 🔖 45
オープンウェイトの大規模言語モデル(LLM)がプロンプト入力による質疑応答の枠を超え自律的かつ高精度な課題解決を行う方向に進化する上で、推論モデルやエージェントワークフローは欠かすことのできない手法となっていますが、より多くのトークンを長時間保持する必要があることからKey-Va
こんにちはAIチームの戸田です最近、Coding Agentを使った開発体験がかなり変わってきています。ファイルを読ませ、コードを書かせ、テストを実行させ、エラーを直させる、という流れはすでに日常的に使える水準になってきました。一方で、Agentに任せられる範囲はコーディン
こんにちはAIチームの戸田です最近、Coding Agentを使った開発体験がかなり変わってきています。ファイルを読ませ、コードを書かせ、テストを実行させ、エラーを直させる、という流れはすでに日常的に使える水準になってきました。一方で、Agentに任せられる範囲はコーディン
月 100万件・ 50億トークンをローカルLLMで捌く - 明細名のストア情報マッピング 🔖 50
こんにちは。ナウキャストの Data Holder Unit 所属、マッピングチームでデータエンジニアをしている翁長です。この記事では、2026 年度の社内 AI コンテストで優勝とテクノロジー賞をダブル受賞(!)した「ローカル LLM を活用したストアブランドマッピング」の取
本日GoogleがリリースしたOpen Knowledge Formatと、以前から注目してたKarpathyのLLM Wikiとの比較を書いていく。Google自身がOKFをLLM Wikiの改良と位置付けている。KarpathyがLLM Wikiを公表した後Anthropic
AI要件定義サミット2026にて登壇
いかにして既存の自律LLMエージェントを超えるエージェントをつくるか - 試行錯誤の痕跡 🔖 1
こんにちは。minamorlと申します。portfolioみなさんAI関連の記事を書いているのを見て自分もAIシステムを作ったので、どのようにして既存の単なるClaude CodeやCodexを超えた自律的なエージェントを作るのか、既存のRAGを超えるのかの知見を共有します。
メモリが潤沢ではないPCでローカルLLMにコーディング質問した結果 🔖 74
この記事は、LiteLLMをやめて自作Goバイナリに置き換えたら一気に軽くなりました - 「実践AIエージェント開発」を実装してみたの実践編です。自作したgo-llm-agentを使い、Ollama経由でローカルLLMにRubyとGoの落とし穴を質問して、回答の正確性を検証しまし
LLM時代に非構造化データを構造化して扱う設計を考える 🔖 2
はじめに最近、非構造化データや現場由来のデータをどうAIで扱うかについて考えることが増えました。これまで非構造化データというと、画像、音声、紙の帳票、動画などは扱いづらいデータという印象が強かったと思います。これらをシステムで扱うには、OCR、音声認識、画像認識など、それぞれ
はじめにベクトル検索ってなんや?と思い調べてみました。これを書いているのは以下の人物です。普段はSQLで業務をしているリレーショナルデータベース(RDB)が思考の土台になっている「ベクトル検索」「embedding」「RAG」という単語は聞くが、自分の知識と地...
【ACL2026 Industry 採択】LLM-as-a-Judge に「唯一の正解」を求めすぎていないか? — ビジネスアイデア評価を通じた「評価の多様性」の分析 🔖 1
Research Division の広田です。今日は先日 ACL 2026 の Industry Track に採択された論文 "Aggregate vs. Personalized Judges in Business Idea Evaluation: Evidence fr
無料で自分のPCで動かせるローカルAIモデルがわかる「LLM Checker」 🔖 86
「LLM Checker」は自分のPCのハードウェアをスキャンしローカルで実行可能なLLMを推薦してくれるCLIツールであり、Ollamaと完全に統合されていることを特徴としています。 Pavelevich/llm-checker: Advanced CLI tool that
「どのLLMがロシアのプロパガンダに対抗するのに優れているか?」がわかるベンチマークをエストニア政府が発表 🔖 19
エストニア言語研究所が、大規模言語モデルのロシア宣伝への耐性を測る「Propaganda Resistance」ベンチマークを公開しました。その結果、AnthropicのClaude Opus 4.7が総合首位となり、NVIDIAやAlibabaのモデルも上位に入りました。 Pr
LLM 大規模言語モデル講座2025講義スライド 🔖 257
LLMについて基礎理論から最新のモデル動向までを一気通貫で学べる実践型講座。 学生や一部社会人はどなたでも無料で受講可能です。 東京大学 松尾・岩澤研究室「大規模言語モデル(LLM)講座 2025 基礎編」講義資料を無料公開中 本資料は2025年10月から11月にかけて開催され、
“育つ”ナレッジ基盤「LLM Wiki」とは?RAGとの違いをイラスト付きで整理してみた 🔖 116
1ヶ月ほど前に公開され、注目を集めた「LLM Wiki」。 少し時間が経ち、改めてどんなものなのか、ざっくり紐解いてみました! LLM Wikiとは Andrej Karpathy氏(OpenAIの創業メンバーであり、Tesla元AIシニアディレクター)がGitHub Gistに
なぜ今「オントロジー」なのか?PalantirとLLMが変えるデータ活用の常識 🔖 137
はじめに 「オントロジー(Ontology)」という言葉を耳にする機会が増えました。 「オントロジー? それって昔のセマンティックWebとか、アカデミックな概念でしょ?」 「ナレッジグラフと何が違うんだっけ?」 それぐらいの記憶だったんですが、最近話題の Palantir(パラン
MLエンジニアのための本質から理解するLLM推論 KV cache編 🔖 41
はじめに 東京科学大学 博士課程の藤井です。本記事では、LLM推論において非常に重要な役割を果たすKV cacheについてより深く理解するために 「Key, ValueだけcacheしてQueryをcacheしないのはなぜか?」 という問いに皆さんが正確に答えられるようになること
MLエンジニアのための本質から理解するLLM推論: LLM Inference Benchmarking 🔖 1
はじめに東京科学大学 博士課程の藤井です。本記事では、LLM Inferenceの速度等をBenchmarkingする際に理解しておくべき基礎的な知識について解説します。多くの論文、Technical Blog等でいかに提案手法によりLLM Inferenceを高速化/最適化で
医療現場の事務作業を支援する高性能な日本語LLMを開発しました | さくらインターネット 🔖 42
NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構) さくらインターネット株式会社 国立大学法人東京大学 株式会社ABEJA 国立研究開発法人理化学研究所 学校法人国際医療福祉大学 学校法人藤田学園 藤田医科大学 国立大学法人東京科学大学 国立大学法人九州大学 株式会社
“育つ”ナレッジ基盤「LLM Wiki」とは?RAGとの違いをイラスト付きで整理してみた 🔖 116
1ヶ月ほど前に公開され、注目を集めた「LLM Wiki」。少し時間が経ち、改めてどんなものなのか、ざっくり紐解いてみました!LLM WikiとはAndrej Karpathy氏(OpenAIの創業メンバーであり、Tesla元AIシニアディレクター)がGitHu...
ローカルLLMでAIエージェントを試す、「Claude Code」を動かしてみる 🔖 17
本特集では、手元のパソコンなどで大規模言語モデル(LLM)を動かし、ChatGPTやGeminiのような生成AIのサービスを実現するシステム「ローカルLLM」を取り上げます。パソコンの選定から、プログラミング向けAIエージェントの動かし方までを解説します。本特集は2026年2月~
クオンツトレーダーがLLMをどこに使うべきか — 「アルファの最終層に置かない」設計入門 🔖 114
2.2 情報収集 — 「読む」を圧縮する クオンツリサーチの体感工数で一番大きいのは、実は「読む」です。 決算説明会・IR資料・論文といった大量の非構造文書をRAG(Retrieval-Augmented Generation) で検索可能にし、引用付きで要約させる構成が王道です
クオンツトレーダーがLLMをどこに使うべきか — 「アルファの最終層に置かない」設計入門 🔖 114
はじめに最近、「LLMでアルファを作れるか」「生成AIで自動売買できるか」という議論をよく見かけます。本稿でいう「アルファの最終層」とは、売買方向、ポジションサイズ、発注タイミング、リスク停止を最終決定する層を指します。結論から言うと、現時点でこの層にLLMを直接置...
社内の知見をAIが漏らさず拾う唯一の設計思想 ― Karpathy氏のLLM Wikiを実践して分かったこと 🔖 68
健適文化という会社をやっています。社内ドキュメントが散らかって検索できない、AIに聞いてもまともな答えが返ってこない、そういう課題に対して、会社のナレッジベースをゼロから構築するお手伝いをしています。この記事はその過程で得た知見をまとめたものです。 先に結論 社内ドキュメントをベ
【特許・知財業務】特許・知財業務の基本まとめと、知財業務とLLMとの相性について 🔖 1
【特許・知財業務】特許・知財業務の基本まとめと、知財業務とLLMとの相性についてこんにちは、株式会社エムニでPM兼エンジニアをしている、まさぴょんです🐱今回は、個人的に携わることが多い分野である特許・知財業務関連のドメイン知識を整理していきます📝 はじめにエンジニアや
LLMサービスのえっちな規制の現状は?どのサービスならロールプレイが捗る? 🔖 43
こんにちは!秋ノ原窓也です! きのう、寝る前に「あー爆乳ナヒーダとえっちな話してえなあ」って思っていつもどおりgrokを開いたんですよ。で、エッチなプロンプトを投げて帰ってきた結果がこれです。 あの、アナーキーでせくしーなことも行けるgrokが拒否反応を示してきたんですよ!?まさ