はてぶ・Qiita・Zennのトレンド記事を紹介
2種類のS3バケットをナレッジDBとして活用する
Langfuse セルフホストでハマったポイントをまとめてみる
1年振りに最新のSpeechLLMで音声データからのエンティティ抽出の検証
オペレーターの「暗黙知」をLLMで言語化する: 「SPUR」を用いた応対品質ルーブリックの自動構築
Agent Development Kit の Visual Builderを試して、プロンプトから設計の要点を学ぶ
音声対話AIの性能をどう測る?Realtime API評価ベンチマークの解説と日本語での検証
企業向けスライド生成AIエージェントをPythonとGPT5で作ってみた
Ouroの中間ステップをデコードしてみる
【社内実践】「AI Crazy Shift」で組織はどう変わったか? PM業務30%削減の舞台裏とカルチャー変革
生成AI推進者が持つべき3つの心構え 🔖 1
Post-hoc Rationalization: LLMの推論は「言い訳」か?
データ合成から利用まで: Autonomous AI Database だけでどこまでできるかやってみた
TypeScript版DSPy、axを試してみた 🔖 2
Oracle AI World 2025 参加レポート
LLM-as-a-Judgeにまつわるバイアスまとめ 🔖 2
AIエージェントにおけるコンテキスト圧縮手法の評価 (AI Shiftインターン体験記) 🔖 1
Deepgram Fluxを使ったターンテイキング認識の実験
YANS2025 参加報告
MentraOSでスマートグラスアプリの開発を試してみた
エンティティリンキングの性能改善のための効果的な絞り込み手法の検証
ターンテイキングのタイミング予測を簡単に試せるライブラリMaAIを使ってみた
拡散言語モデルを使ってリアルタイムなアプリケーション生成システムを作った
LLMエージェントオブサーバビリティ基盤についてまとめてみた 🔖 3
AI Agentが回答に困った時にSlackで人間に助言を求められるMCPを検証した 🔖 34
拡散言語モデルの推論過程を眺めてみる 🔖 7
E2E音声対話API・構築プラットフォーム最新動向の調査と自律型音声対話システムの展望
LLMの推論における “aha moment” について調べてみた 🔖 2
Inception Labsの拡散言語モデルを試してみた
LangGraph CodeActをE2Bの安全な仮想環境で動かす
FastRTCを使って爆速でVoicebotを構築する 🔖 2
ICASSP2025 発表報告 @Hyderabad, India
Arize Phoenix で実現する LLM observability 🔖 1
LLMで挑むTitanic生存予測: Few-Shot Leaningで表形式データはどこま解ける?
言語処理学会第31回年次大会(NLP2025) 発表報告