はてぶ・Qiita・Zennのトレンド記事を紹介
DeepSeekは中国のAI企業が開発した大規模言語モデル(LLM)です。自然言語処理やテキスト生成などの分野で活用されており、中国発の高性能な生成AIモデルとして注目されています。
AI初心者がDeepSeekの論文を読んで感動した話(解説付き) 🔖 42
はじめにこんにちは! 最近AIに興味を持ち始めたばかりの超初心者です。「DeepSeek-R1」についての解説記事を読んでみたのですが、専門用語や数学的な説明が多く、最初はなかなか理解できませんでした。それならいっそ論文を直接読んでみよう! と思い立ち、DeepSeek-R
NVIDIA、GPUクラスタ最適化で「DeepSeek-R1のスループット30倍」 オープンソースで提供 🔖 43
米NVIDIAはが、大規模言語モデル(LLM)の推論を最適化するオープンソースソフトウェア「NVIDIA Dynamo」を発表した。GPU群における処理の割り当てを最適化。計算を最小限に抑え、電力当たりの応答速度や処理能力を向上させるという。