- Google、視覚障がい者向け Android アプリ「Lookout」に画像説明機能「image question and answer(画像の質問と回答)」のクローズドベータ開始
- 「画像の質問と回答」機能は画像を「Google DeepMind」開発の高度なビジュアル言語モデルが認識しユーザーに音声などで説明
- キャプションや代替テキストの有無など一切関係なし
Google は 2023 年 5 月 18 日(木)、2019 年に海外で Android 向けにリリースした視覚障がい者向け被写体認識アプリ「Lookout」に今後追加する画像説明機能「image question and answer(画像の質問と回答)」を発表すると共に、クローズドベータの提供開始を発表しました。
「Lookout」新機能「画像の質問と回答」は、画像に写る被写体や背景などを、Google の AI 分野研究グループ「Google DeepMind」が開発した高度なビジュアル言語モデルが認識し、視覚障がいユーザーに音声などで知らせてくれるユーザー補助機能です。優れている点は、画像に保存されているキャプションや代替テキストを読み取るわけではない点で、キャプションや代替テキストの有無など一切関係なしに、画像から得られた認識情報を教えてくれます。
「image question and answer(画像の質問と回答)」は、「英国王立盲人協会(RNIB)」協力の基に招待された視覚障がいユーザーにて、クローズドベータとして数か月にわたり内部テストが行われます。今後はさらに、提供拡大される予定です。
https://twitter.com/DeepMind/status/1659268340618076167
「Lookout」アプリリンク
Source:Google
「視覚障がい者向けAndroid「Lookout」画像説明機能クローズドベータ開始」への1件のフィードバック