「クアルコムの「聖杯」:生成AIが近々スマートフォンに登場する」

Qualcomm's 'Holy Grail' AI Generation Soon Coming to Smartphones

ChatGPTやMidjourneyのような生成AIは想像力を刺激し、産業に変革をもたらしていますが、それらのデビューは主にデスクトップコンピュータのブラウザウィンドウに限定されていました。来年、プレミアムなスマートフォンがQualcommのトップクラスのチップを搭載して発売されることで、移動中に生成AIを利用することができるようになります。

スマートフォンは数年間AIを使用して写真を修正したり、オートコレクトを改善したりしてきましたが、生成AIツールはモバイル体験に次のレベルの向上をもたらす可能性があります。Qualcommは次世代のプレミアムチップに生成AIを組み込んでおり、これらは10月下旬にハワイで開催されるQualcommサミットで初披露される予定です。

サミットの参加者は、生成AIがスマートフォンにもたらす効果を直接体験することができますが、Qualcommの製品管理担当シニアバイスプレジデントであるZiad Asghar氏は、なぜユーザーがデバイス内のAIに興奮すべきかについてENBLEに説明しました。まず、ユーザーのデータ(運転パターン、レストランの検索、写真など)にアクセスできることで、クラウドベースの生成AIよりもカスタマイズされたソリューションが提供され、より役立つものになると述べています。

「それが究極の目標だと思います」とAsghar氏は述べています。「この技術の進展に非常に興奮しています」

デバイス内で生成AIを利用することには他の利点もあります。最も重要なのは、クエリや個人データの検索がプライベートに保たれ、遠隔サーバーを介して中継されないことです。ローカルAIを使用することはクラウド計算を待つよりも速く、携帯電話サービスが利用できない飛行機やその他のエリアでも動作することができます。

しかし、デバイス内のソリューションはビジネス上も効率的です。Qualcommが先月発表したホワイトペーパーで説明されているように、機械学習モデルが複雑になるにつれて(数十万のパラメータから数十億になるとAsghar氏は述べています)、クエリに答えるためのサーバーの運用コストが高くなっています。今年4月、OpenAIはChatGPTに対するプロンプトへの回答に1日あたり約70万ドルかかると推定されており、このコスト予測はより複雑なGPT-4モデルではなく、より複雑で大規模なメンテナンスコストがかかるGPT-3モデルに基づいています。Qualcommのソリューションは、サーバーファーム全体を必要とせず、デバイスの既存のシリコンブレインが必要なすべての思考を行うことです。

「スマートフォンでAIを実行することは実質的に無料です – あなたは事前に計算能力のために支払いました」とTechsponentialのアナリストであるAvi Greengart氏はENBLEにメールで語りました。

Greengart氏は、Qualcommが2月のモバイルワールドコングレスで展示していたチップメーカーのデバイス内生成AIを実際に見たことがあり、Snapdragon 8 Gen 2搭載のAndroid携帯電話を使用して画像生成ソフトウェアStable Diffusionを実行していました。彼はそれを「非常に興奮するもの」と感じました。

Snapdragon 8 Gen 2チップセット。

David Lumb/CNET

デバイス内生成AIがユーザーに提供するもの

Qualcommは、電話ベースの生成AIを使用して、生産性の向上からエンターテイメントの視聴、コンテンツの作成まで、さまざまなことができると考えています。

Stable Diffusionのデモで示されたように、デバイス内生成AIを使用すると、背景を変更してベニスの運河の前に自分を配置するように依頼するなど、画像を自在に調整することができます。また、完全に新しい画像を生成することも可能ですが、それは始まりに過ぎません。テキストとビジュアルの大規模な学習モデルを連続して使用することで、アイデアから完成した出力までの流れが実現できます。

Asghar氏によれば、複数のモデルを使用することで、ユーザーは自分の話し言葉を自動音声認識でテキストに変換し、それを画像生成器に入力することができます。さらに一歩進めて、デバイスが人の顔をレンダリングし、生成AIを使用してリアルな口の動きを作り出し、テキスト読み上げで返答することもできます。これにより、完全な会話が可能な生成AIパワードの仮想アシスタントが手に入ります。

この具体的な例は、Facebookの親会社であるMetaとMicrosoftとのパートナーシップで最近発表された大規模言語モデルLlama 2など、サードパーティのAIによって一部支えられる可能性があります。

「[Llama 2]は、インテリジェントな仮想アシスタント、生産性アプリケーション、コンテンツ作成ツール、エンターテイメントなどのようなユースケースを構築するための顧客、パートナー、開発者に利用を提供します」とQualcommは当時のプレスリリースで述べています。「Snapdragonによって可能になるこれらの新しいデバイス内AI体験は、接続性のないエリアや飛行機モードでも動作します」

Qualcomm本社の予約制ミュージアムにはレトロな電話がたくさんあります

クアルコムはこれらの機能をスマートフォンに限定しません。同社は今後のサミットで、PCおよび自動車向けの生成型AIソリューションを発表する予定です。そのパーソナルアシスタントは、タスクリストの管理や会議のスケジュール設定、メールの送信などにおいてあなたをサポートすることができます。アスガル氏によれば、もしオフィスの外でプレゼンテーションを行う必要がある場合、AIは新しい背景を生成して車内で座っているようには見えないようにし、スライドデッキを表示することができます(またはプレゼンテーションをサポートすることさえできます)。

「ナイトライダーを見て育った私たちにとって、KITTは今や現実のものとなります」とアスガル氏は述べています。それはこのテレビ番組の象徴的なスマートカーに言及したものです。

プラットフォームに関係なく、基本となる生成型AIソリューションはデバイス内で実行されます。それは通話から自動的にノートを生成し、キーポイントを要約した5枚のスライドデッキを作成するなど、オフィスでの忙しい作業を支援することができます(アスガル氏は「これはまるでClippyのステロイド版ですね」と述べています)。また、ARやVRでデジタルの世界を一から製作することも可能です。

ファンタジーの世界を超えて、生成型AIは視覚障害者が現実世界を移動するのを支援することもできます。アスガル氏は、例えば画像から3D画像、テキスト、音声モデルへのハンドオフを使用して、ユーザーが交差点にいることを電話のカメラで認識し、どの方向からどれくらいの車が来ているかを伝える状況を説明しています。

教育の分野では、ウェブカメラや携帯電話のカメラを使用して、生成型AIは生徒が教育の授業をどれだけ理解しているかを判断することができます。そして、生成型AIは各生徒の強みと弱点に合わせて教材をカスタマイズすることができるとアスガル氏は考えています。

これらはすべてクアルコムの予測ですが、第三者は自社の製品やサービスを改善するためにこの技術をどのように活用するかを決定しなければなりません。スマートフォンにおいては、生成型AIはモバイルアプリと統合されることで、よりカスタマイズされたゲーム体験、ソーシャルメディア、コンテンツ作成に実際の影響を与える可能性があるとTechsponentialのグリーンガート氏は述べています。

アプリメーカーが生成型AI技術を手に入れて調整し、アプリに統合するまで、ユーザーにとってそれがどのような意味を持つのかはわかりません。現在のAIが人々をどのように助けているかを基に、生成型AIが何ができるかを推測することはより容易です。Recon Analyticsのアナリストであるロジャー・エントナー氏は、生成型AIが現在存在する問題、例えば劣化した写真の修正、ソーシャルメディアのフィルターの生成、オートコレクトの改善などに対して解決策を提供すると予測しています。

「生成型AIは、私たちが当然のように受け入れる使用の品質向上を生み出します」とエントナー氏はENBLEにメールで語りました。

製品テストに使用されるリグの前にある赤いパックに収められたSnapdragon 8 Gen 2。

David Lumb / ENBLE

生成型AIはまずプレミアムスマートフォンに登場する

現在の生成型AIソリューションは、大規模なサーバーファームを利用してスケールでのクエリに応えることが求められますが、クアルコムは自社のオンデバイスのシリコンが単一ユーザーのニーズを処理できると自信を持っています。アスガル氏の研究所では、同社のチップが70億のパラメータ(データを評価し、その出力のトーンや正確性を変更する要素)を持つAIモデルを処理しました。これはOpenAIのGPT-3モデルの1750億のパラメータよりもはるかに少ないですが、モバイルの検索には適しています。

「私たちは[Hawaii]サミットでそのデバイス上で実行してみせることができるでしょう」とアスガル氏は述べています。

デモデバイスにはおそらくクアルコムの次世代のトップチップ、おそらく来年のプレミアムAndroidスマートフォンに搭載されるSnapdragon 8 Gen 3が搭載されるでしょう。MWC 2023でデモデバイスが使用されたのは、昨年のSnapdragon Summitで発表されたSnapdragon 8 Gen 2でした。

充電が必要なまでに一日もたないという時代において、一日中生成型AIを呼び出すことがバッテリーの消耗をさらに早めるのではないかという懸念もあります。しかし、実際のテストを待たなければ、どのようにスマートフォンがこの技術を実装し、最適化するのかはわかりません。しかし、アスガル氏はMWC 2023のデモデバイスは一日中参加者のクエリを実行しており、バッテリーが切れたり、熱くなったりすることはなかったと指摘しています。彼はクアルコムのシリコンが非常に優れた能力を持っており、生成型AIは主にSnapdragonチップセットのHexagonプロセッサとニューラルプロセッシングユニット上で実行されるため、「非常に優れた消費電力」を持っていると信じています。

「この処理を行うための専用のハードウェアを持っていない人々にとっては心配があると思います」とアスガル氏は述べています。

アスガル氏は、来年のプレミアムAndroid搭載のQualcommシリコン製のスマートフォンが生成AIを利用できると考えています。ただし、それが安価なスマートフォンにまで普及するには時間がかかります。現在のスマートフォンでも、イメージ、音声、ビデオのクリーンアップのためのAIアシスタントは、上位モデルで最も効果的で、安価なモデルではより効果が低くなります。生成AIの機能も、Qualcommのチップカタログの下に行くにつれて少なくなりますが、それでも存在します。

アスガル氏は、「おそらくプレミアムモデルでは10億パラメータ以上のモデルを作成できるでしょう。その下のモデルではそれより少なくなるかもしれませんし、それ以下のモデルではさらに少なくなるかもしれません。」と述べています。「その経験の優れた性能は、優雅な劣化をしますが、他の製品にも広がっていくでしょう。」

5Gと同様に、Qualcommは生成AIの新しい技術においても最初の存在になるかもしれませんが、最後の存在ではありません。Appleは、オンデバイスのAIを静かに改善しており、ソフトウェアのシニアバイスプレジデントであるクレイグ・フェデリギ氏は、Worldwide Developers Conferenceのチャットでよりパワフルなトランスフォーマー言語モデルを使用してオートコレクトを改善したことを明らかにしました。Appleは、内部で独自の「Apple GPT」チャットボットのテストも行っていると報じられています。このテックジャイアントは、AIの分野で競争するために、大規模な言語モデルを作成するための独自のフレームワークを開発しているとされており、OpenAIが2022年末にChatGPTを一般公開して以来、AIの分野は活発化しています。

次を見てください:

AppleのAIは、GoogleのBard AIやMicrosoftのBing AIとの競争に参入する可能性があります。これらは今年限定リリースされた「インテリジェントチャットボット」モデルの生成AIによるソフトウェアの強化を追求していますが、アプリを通じてスマートフォンに到着するか、またはウェブブラウザを介してアクセス可能になる可能性もあります。GoogleとMicrosoftはすでに生成AIを生産性プラットフォームに統合しており、ユーザーはおそらくGoogle DocsやMicrosoft Officeのモバイルバージョンで最初にその成果を見ることになるでしょう。

しかし、ほとんどのスマートフォン所有者にとって、Qualcommのチップベースの生成AIは新しい技術の最初の有益な利用方法になるかもしれません。来年にも私たちのモバイル体験がどれだけ変わるかは、Snapdragon Summitでの発表を待つ必要があります。