12 4月Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース現地時間の2024年4月11日、Metaがテキストベースの質問に対してAIエージェントの物理空間の理解度を測定することができるベンチマーク「OpenEQA」をリリースしました。続きを読む……このサイトの記事を見る投稿者: 管理者
07 10月AppleのAI研究チームがAIモデル「Depth Pro」をリリース、単一の画像を使用して標準GPUで225万ピクセルの3D深度マップを0.3秒で生成できる機械が深度(奥行き)を認識する方法を大幅に進歩させるモデル「Depth...
04 10月Googleが大規模言語モデル「Gemma 2」のコンパクトバージョン「Gemma 2 2B」の日本語版をリリースGoogleが開発したオープンかつ商用利用可能な大規模言語モデル「Gemma...