はてぶ・Qiita・Zennのトレンド記事を紹介
DeepSeekは中国のAI企業が開発した大規模言語モデル(LLM)です。自然言語処理やテキスト生成などの分野で活用されており、中国発の高性能な生成AIモデルとして注目されています。
ChatGPTとGeminiとDeepSeekとClaudeで5つのテストをして最も優秀だったのはどのモデルなのか? 🔖 71
GoogleのGeminiやChatGPTのOpenAI、OpenAIの元メンバーが設立したAnthropicのClaude、突如登場してAIの開発に対する業界の見方を大きく変えた中国のDeepSeekなど、さまざまなAIモデルが性能のアップデートを繰り返して覇権争いを続けていま
新しいR1で蒸留されたDeepSeek-R1-0528-Qwen3-8Bを試す 🔖 48
あ、ユーザーが日本語で挨拶してきた。 なんか良いですねw 生成し直してみても お、朝から日本語で挨拶が来た。ユーザーは多分日本の会社や学校関係かも? という調子なので、フランクな感じな味付けなんですね。 javascriptプログラミング 出力が長いこともあり具体的な内容は省略し
ティム・バーナーズ=リーが「ソーシャルメディアの壁を壊そう」と提唱、ウェブの発明者が「ChatGPTやDeepSeekの進化形」と呼ぶ新しいインターネットの在り方とは? 🔖 42
ワールド・ワイド・ウェブを発明したことで知られる計算機科学者のティム・バーナーズ=リー氏は、過去に「悪いことが起きにくいソーシャルネットワークが必要」と述べるなど、ソーシャルネットワークによるインターネットの分断を懸念してきました。そして、バーナーズ=リー氏は経済紙・Financ
百度が新生成AI、DeepSeekの6割安 検索離れに危機感 - 日本経済新聞 🔖 19
【湖北省武漢=多部田俊輔】中国ネット大手の百度(バイドゥ)は25日、生成AI(人工知能)を支える基盤モデルを刷新すると発表した。新興のDeepSeek(ディープシーク)のモデルの25〜40%に相当する低価格を実現したという。主力のネット検索の広告収入がAIアプリの台頭で落ち込んで
DeepSeek-R1の数理的背景を理解する - Techtouch Developers Blog 🔖 82
はじめに 対象読者 DeepSeek-R1 の学習アルゴリズム 記号の準備 TRPO(Trust Region Policy Optimization) 補題1 補題1の証明 定理1 PPO(Proximal policy optimization algorithms) GRP
DeepSeek-R1で使われた強化学習アルゴリズムGRPOの解説です。
【東大理3合格】ChatGPT o1とDeepSeek R1に2025年度東大受験を解かせた結果と答案分析【採点協力:河合塾】|株式会社LifePrompt 🔖 55
【東大理3合格】ChatGPT o1とDeepSeek R1に2025年度東大受験を解かせた結果と答案分析【採点協力:河合塾】 「ロボットは東大に入れるか」 国立情報学研究所 新井紀子教授を中心としたプロジェクトチームが取り組んだプロジェクトの終了から10年経たず、生成AIの発展
推論モデルは「思考内容」を出力しているけど実際の思考内容とはズレていることが判明、Anthropicが自社のClaude 3.7 SonnetやDeepSeek-R1で検証 🔖 43
大規模言語モデルの中には、与えられた質問について長時間思考したうえで回答を出力する「推論」という機能を備えたものもあります。推論機能を備えたAIモデルの多くは回答の出力と同時に思考内容も出力するのですが、出力される思考内容と実際の思考内容にズレがあることがAnthropicの研究
DeepSeekがGPUの制限を突破するのに使われたPTX。その制約が突破の原動力になった - 中華IT最新事情 🔖 64
DeepSeekはトレーニングコストが従来の1/10。それには冗長計算の8割をカットするという努力が必要だった。米国政府は中国に対してGPUの制限をかけ、それをDeepSeekチームは突破をしたと量子位が報じた。 冗長計算を8割カットしたDeepSeek DeepSeekがなぜ1
DeepSeek・Baidu・Alibabaなどの中国企業がAIモデルをオープンソースにしているのは「アメリカの規制を回避するため」 🔖 35
中国のAI企業・DeepSeekは2025年1月に、OpenAIのモデルに匹敵する推論モデル「DeepSeek R1」をオープンウェイトで公開し、欧米のAI研究者を驚かせました。その後も中国のAI企業が相次いでオープンなAIモデルを市場に投入していますが、これにはアメリカの規制を
AI初心者がDeepSeekの論文を読んで感動した話(解説付き) 🔖 42
はじめに こんにちは! 最近AIに興味を持ち始めたばかりの超初心者です。 「DeepSeek-R1」についての解説記事を読んでみたのですが、専門用語や数学的な説明が多く、最初はなかなか理解できませんでした。 それならいっそ論文を直接読んでみよう! と思い立ち、DeepSeek-R
AI初心者がDeepSeekの論文を読んで感動した話(解説付き) 🔖 42
はじめにこんにちは! 最近AIに興味を持ち始めたばかりの超初心者です。「DeepSeek-R1」についての解説記事を読んでみたのですが、専門用語や数学的な説明が多く、最初はなかなか理解できませんでした。それならいっそ論文を直接読んでみよう! と思い立ち、DeepSeek-R
AI初心者がDeepSeekの論文を読んで感動した話(解説付き) 🔖 42
はじめにこんにちは! 最近AIに興味を持ち始めたばかりの超初心者です。「DeepSeek-R1」についての解説記事を読んでみたのですが、専門用語や数学的な説明が多く、最初はなかなか理解できませんでした。それならいっそ論文を直接読んでみよう! と思い立ち、DeepSeek-R
NVIDIA、GPUクラスタ最適化で「DeepSeek-R1のスループット30倍」 オープンソースで提供 🔖 43
米NVIDIAはが、大規模言語モデル(LLM)の推論を最適化するオープンソースソフトウェア「NVIDIA Dynamo」を発表した。GPU群における処理の割り当てを最適化。計算を最小限に抑え、電力当たりの応答速度や処理能力を向上させるという。