はてぶ・Qiita・Zennのトレンド記事を紹介
「言葉」で守る自動運転の安全と倫理 –マルチモーダル時代のアラインメント戦略 🔖 1
はじめにチューリングの髙橋です。機械学習やAIにおけるセキュリティやプライバシーの研究開発を専門としています。チューリングでは、「完全自動運転」の実現を見据えて、LLMに視覚理解や行動計画を統合したマルチモーダルAIの研究開発に取り組んでいます。このようなモダリティの統合に加
はじめにTuringの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、PyTorchをsource buildした後に利用する際にCUDA Toolkitをmodule loadしておく必要
はじめにTuringの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、LLM(Large Language Models)やVLM(Vision Language Models)などの学習で
Webスケールの日本語-画像のインターリーブデータセット「MOMIJI」の構築 /巨大テキストデータをAWSで高速に処理するパイプライン 🔖 6
はじめにチューリング基盤AIチームの @stu3dio_graph です。チューリングでは視覚と言語を統合的に理解できるAIを自動運転に応用するため,LLMを視覚モーダルに拡張したVision-Language モデル(VLM)「Heron」の開発に取り組んでいます。チュー
軽量な視覚言語モデル「Heron」のiOSアプリを公開しました 🔖 43
完全自動運転の実現を目指すTuringでは、Webスケールのデータセットで学習した大規模視覚言語モデル(VLM)の持つ「常識」を利用することで、幅広い状況に対応できる自動運転モデルの開発を実現できると考えています。この目標のもと、基盤AIチームでは2023年から視覚言語モデル「
日本語VLM「Heron-NVILA」公開 ─ Qwen2.5-VL-7B・Gemma3-12Bに匹敵する性能 🔖 37
はじめにチューリングの横井です。チューリングでは視覚と言語を統合的に理解できるAIを自動運転に応用するため、Vision Language モデル(VLM)「Heron」の開発に取り組んでいます。このたび、経済産業省およびNEDOが推進する日本の生成AIの開発力強化に向けたプロ
自動運転データセットへのWebDatasetのIndexed Datasetの導入 🔖 1
はじめにこんにちは。Turing MLOpsチームの塚本です。自動運転AIの性能を高めるには、モデルの改良だけでなくデータの量と質が何より重要です。Turingでは「データセントリックAI」の考え方のもと、1日あたり20TBを超える膨大なセンサーデータを活用し、大容量、高品質