アヒルのおもちゃに使われている素材を言い当て、世界地図の上で指さした国の名前をピタリと当てる。2023年12月7日（日本時間）にGoogleが公開したマルチモーダルなAI（人工知能）モデル「Gemini」のデモ動画は、多くの人に衝撃を与えました。動画を見る限り、ユーザーの音声とカメラの映像を頼りにして、AIが人間と現実空間で自然な応答ができているように見えたからです。

　筆者自身も「マルチモーダルAIはここまで進化しているのか！」と度肝を抜かれました。……が、良く見るとデモ動画の冒頭には「Geminiとの好ましいインタラクションを強調したもの」（動画より）という注意書きが。つまり、この動画にはGoogleによる編集加工が入っているのです。現実のGeminiの性能を直接反映したものではないことは意識すべきでしょう。

　さて、Googleの発表ではGeminiの処理性能のポテンシャル以外で注目すべきポイントがもう1つありました。スマートフォンなどのモバイル端末でオンデバイス処理が行えるモデル、「Gemini Nano」の存在です。

#CmsMembersControl .CmsMembersControlIn {width:100%;background:url(https://image.itmedia.co.jp/images/spacer.gif) #DDD;opacity:0.05;filter:progid:DXImageTransform.Microsoft.Alpha(Enabled=1,Style=0,Opacity=5);z-index:1;}

続きを閲覧するには、ブラウザの JavaScript の設定を有効にする必要があります。

≫MONOistメールマガジン編集後記バックナンバー
エッジでも生成AIは可能、マクニカが「Jetson AGX Orin」に日本語LLMを実装
マクニカは、「EdgeTech+ 2023」において、NVIDIAの組み込みAIボード「Jetson AGX Orin」を用いてエッジデバイス上で生成AIモデルを動作させるデモを披露した。
「この動画に何が映っている？」、生成AIを助けるプロンプトを開発
日立製作所は車載カメラの動画に関する説明文を自動生成する技術を開発した。動画のデータベースから必要なシーンを含むものを自然言語で検索できるようになり、ADASや自動運転システムの開発に使うデータを抽出する時間を大幅に短縮するとしている。
技術ありきで生成AIは導入しない、日立が見据える「DX2周目」の堅実な戦い方
大手企業を中心に進む「生成AI」の導入。一方で「技術ありきの改革」に陥らないようにするにはどうすればよいのか。日立製作所の吉田順氏に、同社の生成AI活用の現状と併せて尋ねた。
NVIDIAのGPUインフラが生成AI開発でも優位性を発揮できる理由とは
本稿ではNVIDIAが開催したオンラインイベント「NVIDIA 生成AI Day 2023 Fall」での講演、「生成AIの開発と運用を支えるエヌビディアの最新インフラ」の内容を紹介する。
米ロックウェルが生成AIの活用を推進、生産工程の未来を創造
Rockwell Automation（ロックウェル・オートメーション）は、年次イベント「Automation Fair 2023」を開催。基調講演では同社取締役会長兼 CEOのBlake Moret氏とMicrosoft CCOのJudson Althoff氏が対談した。