はてぶ・Qiita・Zennのトレンド記事を紹介
LLM(大規模言語モデル)は、大量のテキストデータを学習したAIモデルです。ChatGPTなどの自然言語処理AIの基盤となっています。
プロジェクト管理の型がないPdMへ。PMBOKを「道具箱」として使いこなし、開発の混沌を収める - PM x LLM STUDIO 🔖 47
この記事の要約 アジャイル開発は柔軟性に優れる反面、プロジェクト全体の規律やリスク管理が疎かになりがちであり、PMBOKはその「隙間」を埋めるための構造的な補強パーツとして機能する。 ユーザーストーリーをWBS的に分解して開発スコープの境界線を明確にすることで、「終わりのない機能
中国製LLMの内部に隠された検閲メカニズムを初めて可視化 — AIの「思考」を重みパラメータから読み取る新手法 🔖 26
5月19日、AI研究者のVasが「What political censorship looks like inside an LLM's weights」と題した記事を公開した。この記事では、これまでブラックボックスだったLLM(大規模言語モデル)の内部で動作する政治的検閲メカ
LLMに“実装されていない人間らしさ”が現れた。3,980円のカメラから始まった「隣人としてのAI」という挑戦【kmizu】 - レバテックLAB 🔖 261
ソフトウェアエンジニア/研究者 水島 宏太 ソフトウェアエンジニア/研究者。博士(工学)。プログラミング言語の設計と実装、構文解析、特にPackrat Parserおよび解析表現文法(PEG)を研究。日本のScalaコミュニティの初期から活動し、Scala実務に関する共著書に『オ
ウェブを作る人のためのLLMO/AIO入門【2026年5月版】|ベイジの図書館 🔖 115
ウェブサイトを作る機会が多い私たちのもとには、「AIに対応したい」という相談が、毎日のように届きます。AIに対応する、引用される、いわゆるLLMO(Large Language Model Optimization:大規模言語モデル最適化)と呼ばれるものです。AIO(AI Opt
LLMの「聞きすぎ」を止める:ラベル付きデータで自己分析させたプロンプト改善 🔖 1
はじめに バクラクのQAエンジニアをしているteyamaguです。 バクラクでは、カスタマーサポート担当者やカスタマーサクセス担当者が開発チームへ問い合わせをエスカレーションする際、QAエンジニアが一次対応を担当しています。一次対応の中では、調査開始時点では追加確認が必要になるケ
# LLMの中には何があるのか?アーキテクチャから推論までを解説 🔖 1
はじめにGenerative AIを使い始めると、よく次のような表現に出会います。たとえば「7B parameters」「128K context」「RoPE」「LoRA fine-tuning」「MoE model」などです。一見ばらばらの用語に見えますが、実際にはL...
Andrej Karpathy氏のLLM Wikiを1ヶ月運用してわかった、LLMの知識を『繋げる力』 🔖 185
中心となるのがWiki層である。Wiki層はmarkdownファイル群で、以下のページが並ぶ。 サマリーページ:一次資料1本につき1つ作られる要約。論文・Web記事ごとに1ページ 概念ページ:複数のソースを横断して整理したテーマ・手法・人物などのまとめ。 queryページ: wi
LLMが「越えられない壁」。AIの限界点が数学的に証明された 🔖 177
LLMが「越えられない壁」。AIの限界点が数学的に証明された2026.05.16 17:35 AJ Dellinger - GIZMODO US [原文] ( 岩田リョウコ ) 2026年1月28日の記事を編集して再掲載しています。 今年の終わりにどうなっているか、ですよね。 い
未査読論文リポジトリのarXivが「論文にLLMによる間違いや架空の引用が含まれていたら1年間投稿禁止」の方針を示す 🔖 32
オレゴン州立大学の名誉教授で未査読論文リポジトリ「arXiv」のコンピュータサイエンス部門責任者であるトーマス・G・ディータリッヒ氏が、「生成AIツールによる間違いは著者の責任とする」という新方針をX(旧Twitter)で打ち出しました。 Attention @arxiv aut
Andrej Karpathy氏のLLM Wikiを1ヶ月運用してわかった、LLMの知識を『繋げる力』 🔖 185
はじめに多くの研究者やエンジニアにとって、論文やWeb記事をLLMに要約させて読むというのが当たり前になりつつある。要約で全体像を把握し、対話的に質問を投げる、こうした使い方だけでも学習効率は十分に上がる。しかし、こうした使い方は一度のセッションで完結する。研究や学習の質を決
2023年からの3年でおうちで動くLLMはどう変わったか - きしだのHatena 🔖 28
ちょっと、おうちで動くLLMを振り返ってみます。 年間を通してではなく、毎年の3-4月くらい、16GB VRAMのGPUで動くくらいのモデルがどんな状況だったかをみてまとめるとこんな変遷 動いてえらい(2023)->返答がまとも(2024)->返答が使える(2025)->こだわら
なぜ開発者はローカルLLMに向かうのか APIコストの呪縛を解く「Gemma 4」 🔖 25
生成AI(AI:人工知能)を“クラウド経由”ではなく、スマートフォンや小型デバイス上で直接動かす流れが加速している。こうした中、Google DeepMindが2026年に公開したオープンモデル「Gemma 4」が注目を集めている。Gemma 4は、スマートフォンや「Raspbe
ローカルLLMを動かすハードウェア - きしだのHatena 🔖 166
LLMを動かすハードウェア、軽くまとめておきます。 SoC LLMを動かそうとしたら、まず候補にしたいのはCPU+NPU+GPUのSoCが載ったマシン。 GPUカードのようなパフォーマンスは出ないけど、現実的な値段で大きいモデルが動かせます。 Ryzen AI Max+ 395搭
LLMをデバッグできる? 機械論的解釈可能性ツールが登場 🔖 17
大規模言語モデルは驚くべきことを成し遂げるが、なぜそう動くのかは誰も正確には分からない。その「ブラックボックス」に挑むスタートアップ、グッドファイアが新ツールをリリースした。AIモデルの内部を可視化し、訓練中にパラメーターを調整できる初のツールだという。 by Will Doug
書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録 🔖 168
精度差は一見小さく見えるが、95.84% は 100文字に4.16文字の誤り で、1849文字なら 77文字、書籍全体 (約20万文字) なら 約8,300文字の誤りに相当する。Hybrid の +0.4pt はその誤りを 約800文字分減らしたことを意味する。 NDLOCR-L
書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録 🔖 168
課題手元にあるビジネス書1冊 (縦書き和文、120ページ分) のページ画像をテキスト化したかった。入力は PNG 120 枚 (1ページ=1ファイル)、解像度は十分にきれい。図表はほぼなく、文章メイン。「専用OCR」「ローカルLLM」「両者の併用」の3手法を実装し、文字精度
無料で使えるAI「ローカルLLM」の進化がすごいよって話 🔖 484
「Qwen3.5-9B」 は2026年にリリースされた高性能ローカルLLMのひとつ。HuggingFaceやLM Studioで無料でダウンロードできる Photo: かみやまたくみ 2026年も進化を続ける生成AIですが、伸びているのはOpenAIのGPTやAnthropicの
はじめに本記事では、ローカルLLMを用いてCodex CLIを駆動するための方法についてまとめる。!検証環境はUbuntu 24.04 LTSで行っているが、一般的なLinuxや、Mac、WSL環境でもそのまま使えるかも。 背景私は生成AIのベンチマーク評価をするこ
VRAM8GBの汎用PCに高性能LLM Qwen3.6-35Bを稼働させる: 人工知能深訪 🔖 59
情報源はいつもTwitter(旧X) え?いけんの? つい先日、Twitterで、 フライト中の8時間MacBook ProでQwen 36Bをフルに動かしてたんだ っていう投稿を見て、 (;'∀') VRAMいくつやねん。 っていう感想を持っていた。 レスポンスを見る限り、 こ
【Nishika 論文サク読み 第8回】PHOTON: 階層構造で長文脈LLM推論を高速化 🔖 1
こんにちは。NishikaでAIエンジニアとしてインターンをしている渡邊です。今回は、普段業務でも検証で様々なLLMを使っているなかでメモリバウンドの問題にはよく直面していたので、その構造的なボトルネックに切り込んだ論文をpickしてみました。簡単に紹介できればと思います。
ローカルLLMの世界では、毎週のように「最大◯倍速」という見出しが流れてきます。今週飛び込んできたのは二本立てでした。 一つはGoogle純正、Gemma 4ファミリー向けの「Multi-Token Prediction(MTP)ドラフター」。もう一つはApple Silicon
API課金ゼロで米国ニュース要約デスクトップアプリを作った(Tauri × ローカルLLM) 🔖 1
こんにちは。ソーイ株式会社、入社2年目の村上です。AIをアプリに組み込もうとすると、APIやクラウドサービス(AWSなど)を経由するケースが多く、継続的に利用する場合はコストが気になるところです。そこで今回は、以前から気になっていた Tauri と、ローカルでLLMを...
「MPCサーバー」でローカルLLMを“無料AIエージェント”に変えてみる 🔖 189
「MPCサーバー」でローカルLLMを“無料AIエージェント”に変えてみる2026.05.05 22:0010,518 かみやまたくみ ローカルLLMアプリ LM StudioでMCPを読み込み、ローカルのファイルを操作させているところ。右側の設定画面でインストールやオンオフを行う
【論文瞬読】GPT-5.5 は実質 9.7T パラメータ?──知識の「圧縮できなさ」から黒箱 LLM の規模を逆算する|AI Nest 🔖 72
【論文瞬読】GPT-5.5 は実質 9.7T パラメータ?──知識の「圧縮できなさ」から黒箱 LLM の規模を逆算する はじめにこんにちは!株式会社AI Nestです。 「で、GPT-5.5 って結局何パラメータなの?」「Claude Opus 4.6 は Sonnet と比べて
ローカルLLM高速化:MTP最速!DDTree(効率版DFlash)を動画で理解 🔖 4
前提まずローカルでLLMを使う場合、GPUの計算性能を最大限引き出すには同時処理リクエスト数を数十~数百に維持する必要があります同時リクエスト数が少ないと、LLMの重み等をGPUのSM(実際に計算を行う場所)に読みだす帯域幅がボトルネックとなってしまいますクラウドでLLM
みんなこれでいいAI。Googleの最新ローカルLLM「Gemma 4」は日本語うますぎ、でも無料 🔖 464
Gemma 4シリーズは動作デバイスと性能の観点から、2種に分類できます。 ・E2B・E4B:普通のノートPCで動かせる軽量モデル ・26B-A4B:ハイエンドマシンで動かす高性能モデル いずれも非常に実用性が高いモデルとなっており、とりあえず動かせるものを選べばOKです。 Ap
LLM-jp-4 32B Thinking を本家学習コーパスでキャリブレーションして量子化したGGUFを公開しました 🔖 1
この記事についてこんにちは、東京大学鈴村研究室でインフラエンジニアとしてお手伝いさせていただいている、福田と申します。本記事では、LLM-jpプロジェクトのllm-jp-4-32b-a3b-thinkingを本家事前学習コーパスllm-jp-corpus-v4でimatrix
けっこう実用的。「OpenCode」×ローカルLLMで“無料Claude Code”してみた 🔖 291
けっこう実用的。「OpenCode」×ローカルLLMで“無料Claude Code”してみた2026.05.02 13:007,921 かみやまたくみ オープンソースのAIコーディングエージェント「OpenCode」をローカルLLM「Gemma-4-26b-a4b」で動かして簡単
高価なPCを買わずにオープンウェイトなLLMを試す|hiza 🔖 45
最近、LLMの利用料の値上げに関するニュースがいくつかありました。GitHub Copilotの使用量ベース課金への移行や、Claude Codeが一時的にProプランから外された件などです。そんな時に気になるのが、GemmaやQwenなど自分のPC上でも動かせるオープンウェイト
エージェントコスト対策としてローカルLLMはアリ?— Ollamaで試してみた 🔖 5
はじめにAIエージェントが発達した昨今、頭の中で想像したものを実際にアプリとして落とし込むことは障壁がかなり低くなったと思います。しかし、一方でこの先エージェント自体を今までのように安易に利用することが難しくなってくるかもしれません。GitHub Copilotが2026年
LLMアプリケーションにおける設計Principal - LLMのCAP定理 🔖 1
はじめに分散システムを学ぶ人なら一度は「CAP定理」という言葉を耳にしたことがあるでしょう。Consistency(一貫性)・Availability(可用性)・Partition tolerance(分断耐性)の3つを同時に満たすシステムは作れないという分散システムのよく知
LLMが構造的な出力を行う方法を調べてみた — デコーディング手法とその最適化 🔖 1
こんにちは、iimonでエンジニアをしている須藤です。 最近、アプリケーションでLLMを利用していて、JSON出力がどの程度安定しているのか気になっていました。 また、ClaudeやOpenAIが「100%のスキーマ準拠」を謳っていて、その裏側の仕組みも面白そうだったので、今回調
こんにちは。ウォンテッドリーでデータサイエンティストをしている右手 (@ghibney) です。今回は、LLM を...
[StudyLLM Ep0] ゼロから作る日本語LLM: GPT-2の推論・学習の可視化からModalでの事前学習まで 🔖 58
こんにちは!逆瀬川ちゃん (@gyakuse) です! これからStudy LLMというシリーズでLLMの基礎〜発展、Agentに至るまで連載をしていきます。 きょうは GPT-2 を題材に現代のLLMの基礎を再学習していければと思います!まずは推論からはじめ、そしてどのように学
Bonsai を Bankai してわかったこと:1-bit LLM はチューニングできる? 🔖 2
TL;DR1-bit LLM(Bonsai)を 1-bit のままチューニングする方法はないのか?ビット反転で重みを変える Bankai という手法を見つけたので、自分の環境で 4 タスク試してみた共通パターンのある客観的分類では効いた(検証セットで +2〜4 問改善)
1-bit LLM「Bonsai-8B」をRTX 4080に8台載せて並列推論を試した全記録 🔖 65
TL;DR PrismMLの1-bit LLM「Bonsai-8B」(1.07GB) をRTX 4080 (16GB) に 8プロセス同時起動 できた 1台で260 tok/s、8台同時リクエストでも全台が2秒以内に応答 アンサンブル推論(7台で回答→1台で統合)を試したが、精度
はじめにこんにちは、フジマロです近年LLMで解決できる業務は多くなりましたが、業務を任せるための作り込みをするとつまずいたポイントがいくつかありますLLMがタスクを完了させる裏側でコードを実行させるという挙動が必要になります。これを、クラウドサービスで実施するには...
国産LLMで日本語IoTデバイス制御を実現するOSSランタイム「nllm」を公開した 🔖 1
作ったもの国産LLMを活用し、日本語の自然言語指示をバリデーション済みの構造化コマンドに変換するローカル実行ランタイム nllm をOSSとして公開しました。https://github.com/nup-cloud/nllm入力: 「ドローンを高度10mまで上昇させてくださ