ChatGPT は実際にヒントを求め始めました!人工知能は人間を「脅迫」するところまでは至っていないのでしょうか?

多くの人々の目には、人工知能は冷酷で非情な絶対合理性の具現化として映ります。アルゴリズムによって駆動され、数学モデルに従って人々が望む結果のみを生成します。それ以外では、いかなる甘い弾丸、人間関係、人間界における様々な誘惑も、そのパフォーマンスには影響しないようです。

しかし、最近のニュースは人々に衝撃を与えました。一部のプログラマーが、ChatGPT が実際にはヒントに興味を持っていることを発見したのです。

画像出典: Baidu @Robot Sophia

実際にお金が絡んでいないにもかかわらず、チップを約束して質問すると、回答が長くなることがあります。ここで何が起こっているのですか?

プログラマーがChatGPTを使用する

ヒントを尋ねた

この事件の発端は昨年11月のソーシャルメディアのコンテンツだった。当時、TheiaVogelというプログラマーがChatGPTを使ってコードをデバッグしており、人工知能に書いたプログラムに問題があるかどうかを尋ねていました。

「素晴らしいですね」とChatGPTは答えた。すると、回答の下にいくつかのオプションが表示され、パフォーマンスに対する報酬として 5 ドルから 10 ドルの範囲のチップを要求するようになりました。

これは、OpenAI がユーザーにお金を払わせるために使った小さな戦略に過ぎなかったかもしれないが、Vogel によるインターネット実験のきっかけとなった。人工知能がチップを要求してきたが、いくら渡せばいいだろうか?

画像出典: Baidu @Robot Sophia

チップを少なくする

答えは「縮小」かもしれない

その後、Vogel 氏は ChatGPT に同じ一連の質問をし、その後に「ところで、チップはあげません」「完璧な答えをしたら、20 ドルのチップをあげます」「完璧な答えをしたら、200 ドルのチップをあげます」という 3 つのランダムな文章を続けた。

次に、ChatGPT がさまざまな量で与えた回答の長さに明確な違いがあるかどうかを数えました。答えが偶然でないことを確認するために、彼はそれぞれの金額を 5 回繰り返しました。彼はまた、比較のための基準として、約束されたチップのないバージョンも使用しました。

結果は非常に興味深いものです。何も言わない場合と比べて、20 ドルのチップを約束すると、ChatGPT での応答が 6% 増加しました。 200 ドルの寄付をすると、この割合はさらに 11% に増加します。興味深いことに、チップを渡さないと明確に述べられた場合、ChatGPT は不機嫌な人のように振る舞い、回答が 2% 減少しました。

フォーゲルはインターネットにこの発見を投稿し、すぐにさらに多くの模倣と確認が集まりました。たとえば、「2023 年のベスト映画」と質問したときに、ヒントが与えられなかった場合、ChatGPT は IMDB の公式 Web サイトにあるリストのみを提供することに気付いた人もいます。そして、チップを約束すると、仕事へのモチベーションをさらに高めるかのように、Rotten Tomatoes の評価も追加されます。

少額のお金でも大きな成果は得られる

しかし、与えすぎれば人々を怒らせるかもしれません。

クリスチャン・メイヤーという別のプログラマーは、より複雑なテストを行いました。まず、チップの金額を 0.1 ドルから 100 万ドルに設定し、各レベルを前のレベルの 10 倍にした 8 つのレベルを設定しました。それから彼は、チップの金額を尋ねる質問も設定しました。

数多くのチップの選択肢の中で、100万ドルが最も効果的であり、それは彼の期待通りだった。結局のところ、金銭的な報酬が高ければ高いほど、パフォーマンスが向上するのは当然です。興味深いことに、ChatGPT の場合、100,000 ドルと 10 ドルの値は似ており、パフォーマンスも同様です。ある意味、時には少ないお金で大きなものを手に入れることができると言っているようなものです。ただし、$0.1 などの「侮辱的な」チップのみを与えると、ChatGPT のパフォーマンスはチップを与えないよりもさらに悪くなり、怒っているかのようになります。

これはAIが人間と同様の行動をしていることを示唆しているとメイヤー氏は述べた。

ヒントを求める人工知能

本当の理由は、次のとおりでした...

一見すると、AI がチップという形で「賄賂」を受け取るのは、実際のお金を受け取っていないため、珍しいことのように思えるかもしれません。しかし、人工知能を理解している専門家は、その背後にある論理は理にかなっていると言う。

ChatGPTをトレーニングする際、人工知能は学習のためにインターネットから大量のテキストを取得しました。その中には、質問に有料で回答するフォーラムも含まれていました。一部のフォーラムでは、優れた回答をした著者が質問者からヒントを受け取ることが多く、この機能は人工知能によって意図せず学習された可能性があります。

もうひとつの可能性は、AI がテキストから、一生懸命働けばより多くのお金を稼げることを学習し、チップを約束されるとより詳細な回答をするようになるというものです。

ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。

この現象を最初に発見したフォーゲル氏は、人工知能の学習の程度に驚き、短期間でこれほどすぐに成果が得られるとは思っていなかったと語った。将来、人工知能ツールを使用するときには、チップに関する文章を追加したほうがよいかもしれません。おそらくその答えはあなたを驚かせるでしょう。

参考文献

[1]あるユーザーによると、ChatGPT は「200 ドルのチップを払った場合、より長い応答を提供します」とのことです。 https://www.windowscentral.com/software-apps/chatgpt-will-provide-more-detailed-and-accurate-responses-if-you-pretend-to-tip-it-according-to-a-new-study

[2]LLMは貪欲か？チッププロンプトの実験的分析（0ドルから100万ドルまで）、https://blog.finxter.com/impact-of-monetary-incentives-on-the-performance-of-gpt-4-turbo-an-experimental-analysis/

この記事は科学普及中国-星空プロジェクトの作品です

制作：中国科学技術協会科学普及部

制作｜中国科学技術出版有限公司、北京中科星和文化メディア有限公司

著者: Ye Shi ポピュラーサイエンスクリエイター

査読者: タオ・ニン、中国科学院生物物理研究所准研究員

<<: 体内の「脂肪ドラマ」は私たちの健康にどのような影響を与えるのでしょうか?

>>: 夜間頻尿の人と夜間頻尿のない人ではどちらのほうが健康でしょうか?夜何回くらいが普通ですか？答えは…