「’AI drift’とは何ですか、そしてなぜChatGPTを愚かにしているのでしょうか?」

AI driftとは何ですか、そしてなぜChatGPTを愚かにしているのでしょうか?

ChatGPTを自分で使ったことがあるか、それについて読んだことがあるかにかかわらず、噂は本当です。ChatGPTは徐々に賢くなっていません。

この現象は特に困惑させられるものです。なぜなら、生成型AIモデルはユーザーの入力を使用して自己学習を継続的に行うため、時間の経過とともにより知能的になるはずだからです。

さらに: ChatGPTを使用してアプリを作成する方法

その答えは、「ドリフト」という概念にあるかもしれません。

「ドリフト」とは、大規模言語モデル(LLM)が元のパラメータから予期せぬまたは予測できない方法で振る舞うことを指します。これは、複雑なAIモデルの一部を改善しようとする試みが、他の部分のパフォーマンスを悪化させるために起こる可能性があります。

カリフォルニア大学バークレー校とスタンフォード大学の研究者は、ドリフトを評価し、ChatGPTの人気のある大規模言語モデル(LLM)であるGPT 3.5(ChatGPTの背後にあるLLM)とGPT-4(Bing ChatとChatGPT Plusの背後にあるLLM)が時間とともにどのように変化するかを調査するために研究を行いました。

さらに: 最高のAIチャットボット

この研究では、3月と6月における両方のLLMの数学の問題の解決能力、機密情報に対する回答能力、意見調査への回答能力、マルチホップの知識集約型の質問への回答能力、コード生成、米国の医療ライセンス試験、視覚的な推論タスクの能力を比較しました。

上記の研究結果から分かるように、GPT-4の3月のバージョンは、多くの場合で6月のバージョンよりも優れており、特に基本的な数学の問題では、例(a)と(b)の両方で3月のバージョンのGPT-4が優れていました。

GPT-4はまた、コード生成、医療試験の問題への回答、意見調査への回答で悪化しました。これらのすべての事例は、ドリフト現象に帰することができます。

ドリフトについて、研究者の1人であるジェームズ・ゾウはウォールストリートジャーナルに対して、「ここで起こる可能性があることには疑念がありましたが、ドリフトがどれほど速く起こるかには非常に驚かされました」と述べています。

さらに: GPT-3.5とGPT-4: ChatGPT Plusの定期購読料金は価値があるのか?

知能が低下しているにもかかわらず、GPT-4とGPT-3.5の改善事例もありました。

その結果、研究者はユーザーに対して、LLMを引き続き使用するように奨励していますが、使用する際には注意を払い、定期的に評価することを常に心掛けるようにと助言しています。