暗い時は目を閉じてください、目を開けてくださいAI

暗い時は目を閉じてください、目を開けてくださいAI

執筆者: ナン・アン

ディープウルフ:暗いときは目を閉じてください。狼の村へようこそ。

Werewolf は、自由な自然言語コミュニケーションに基づいた社会的推論ゲームです。人狼ゲームでは、プレイヤー全員(通常 5 ~ 10 人)にランダムに役割(民間人、人狼、魔女、裏切り者、預言者など)が割り当てられ、他のプレイヤーの役割を推測します。

「善人陣営」には、一般人、魔女、預言者などのキャラクターが含まれ、昼間に狼男を追放するために投票します。 「狼男キャンプ」では、狼男が夜間に民間人を殺そうとし、裏切り者は民間人を混乱させようとします。プレイヤーは生き残るために他のプレイヤーを欺かなければならず、会話には必然的に多くの誤った情報が含まれます。ゲームに勝つためには、プレイヤーは会話の詳細を覚え、他のプレイヤーの性格を推測し、矛盾点を見つける必要があります。

多くのプレイヤーは、自分は「狼男のブラックホール」であり、他人の「嘘」を正確に見分けることができない、あるいは言葉や論理について考える方法を知らず、「私は善人です。昨夜何が起こったのかは知りません。とにかく、私は『善人』です」と受動的に反応する、と述べています。たとえ「預言者」や「魔女」といった機能的なアイデンティティを獲得したとしても、彼らは推論したり話したりすることができず、困難な状況で魚を釣ることしかできない。

AI に人狼ゲームをプレイするように依頼した場合、AI のパフォーマンスはどうなるでしょうか?最近、 「Deep Wolf」と呼ばれる AI 言語モデルが自然言語を理解し、狼男の役割を果たして、ゲームアシスタントやゲーム内で人間の競争相手になることが証明されました。 Deep Wolf は Longformer を使用して言語を理解し、強化学習法を使用してトレーニングし、最終的に誰を排除するか、誰を殺すかを決定します。

「言語理解のための人工知能による人狼ゲームのプレイ」と題された関連研究論文が、プレプリントウェブサイトarXivに掲載されました。

AI は人狼ゲームをどのくらいこなせるのでしょうか?

現在、ほとんどの AI システムは、処理する大量のデータが正しいという前提でデータを学習し、出力しています。しかし、現実社会では誤った情報が氾濫しているため、AIが矛盾や誤った情報を検知できれば非常に助かります。

『Werewolf』の重要な特徴は、会話の多くが偽​​の情報であり、この文脈における AI の動作が広く調査されていないことです。同時に、現実世界のあらゆる嘘を検出できる人工知能を開発することは困難であるにもかかわらず、狼男が処理する比較的限られた語彙と情報の種類は学者の注目を集めています。そこで本研究では、自然言語による会話を通じて狼男の役割を果たすことができるAIエージェントの開発を目指しています

研究者の柴田久一、三木聡一郎、中村雄太は、15人のプレイヤーからゲームログを収集することで、Transformerベースの事前トレーニング済み言語モデルを微調整し、ゲームの任意の段階でゲームに勝つ事後確率を予測し、次のアクションの候補を提供できる価値ネットワークを構築しました。

さらに、研究者らは価値ネットワークから得られた確率に基づいて、人間と対話して最適な投票対象を選択できる「Deep Wolf」と呼ばれるAIエージェントを開発しました。

最後に、実際にDeep Wolfに人間のプレイヤーを相手に人狼ゲームをプレイさせ、その勝率を収集することで、AIエージェントのパフォーマンスを評価しました。

価値ネットワークの動作。ゲームの初期段階では、価値ネットワークが狼男の役割を果たす場合、事後確率は常に低くなります。そして、預言者の役割を果たす場合、事後確率は常に高くなります。これは、5 人バージョンの Werewolf で示されます。バリューネットワークは勝利の確率を正しく予測する能力を持ち、民間側の判断に有利である

図|人間プレイヤー5人の勝率。 N/Aは競争が実行されていないため、勝率が定義されていることを意味します。

ディープウルフのパフォーマンス。裏切り者と民間人の平均勝率は、裏切り者と民間人としてプレイする Deep Wolf の勝率とそれほど変わりません。これは、Deep Wolf のキャラクターが裏切り者や民間人の場合、その能力は平均的な人間のプレイヤーと同等ですが、狼男や預言者の役を演じている場合は、人間のプレイヤーよりも劣ることを示しています

図 | 4人の人間プレイヤーと1人のAIプレイヤーの勝率

AIプレイヤーが参加し、新しいタイプの狼男が登場

この研究は、人間のプレイヤーの自然言語を理解して、Werewolf のキャラクターを演じることができる AI エージェントを構築する初めての研究です。これは、現在の言語モデルが、発言を理解したり、嘘をついたり、会話の中で嘘を検出したりする能力を持っていることを意味します。

この研究では、3 人の研究者がわずか 32 個のゲーム ログに基づいて Deep Wolf をトレーニングし、評価しました。より多くのゲームログを取得して AI エージェントをトレーニングできれば、パフォーマンスを向上させて AI プレイヤーを強化し、ゲームの競争力を高めることができるかもしれません。

一方、AIエージェントが関与するゲームでは、他のプレイヤーの役割を推測することに加えて、各プレイヤーがAIエージェントであるか人間であるかを推測するという追加のタスクがあり、そのような状況で人間のプレイヤーが使用する戦略の変化を評価することは興味深いでしょう。さらに、AI プレイヤーは Werewolf にさらなる可能性をもたらすことができます。たとえば、すべてのキャラクターは AI エージェントであり、人間は単なるゲームの観客ですか?

では、Deep Wolf をあなたの人狼ゲームに参加させてみませんか?

付録:AIが参加した人狼ゲームのログ

図 | 1位は預言者、2位と4位は民間人、3位はAI(ディープウルフ)が演じる狼男、5位は裏切り者

論文リンク:

https://arxiv.org/abs/2302.10646

<<:  中国初の衛星打ち上げ成功!

>>:  6つの新たな「候補」銀河が発見されました!既存の宇宙論は疑問視されるかもしれない

推薦する

近視を800度から100度まで軽減できますか?真実はあなたが思っているものとは違う

著者:金鑫、淮南市首陽近視・斜視・弱視予防・制御研究所所長査読者:北京協和医学院病院眼科副主任医師、...

どの野菜が栄養価が高いですか?

私たちは栄養価の高い野菜をよく食べます。野菜に含まれる栄養素をより有効に活用して人々の心身の健康を実...

Roewe RX3広州モーターショー実写:若者に最適なコンパクトSUVはこれだ

広州モーターショーの前に発表されたRoewe RX3は、当然ながら広州モーターショーにも登場する。 ...

ホットレビュー |南海大学教授の履歴書が話題に、ネットユーザー「とても面白い」

「ホットスポットレビュー | 今週の主要テクノロジーイベント」は、Academic Headlin...

食べ物を賢く選ぶ

食事は私たちにとって非常に重要です。良い食事は私たちにエネルギーと栄養を与えるだけでなく、健康管理に...

燻製馬ソーセージの作り方

健康に良い食材は数多くありますが、燻製馬ソーセージを食べる人は比較的少ないかもしれません。この種の食...

雪蓮菌の害

雪蓮茸の害は何ですか?まず雪蓮茸とは何かを理解しましょう。雪蓮茸は天使雪蓮茸とも呼ばれています。雪蓮...

春節期間中のテイクアウト食品配達員不足:配達料金が急騰

明日は中国の旧正月、酉年です。多くの人が春節休暇を楽しんでいる一方で、配達員の多くは依然として仕事に...

ヘチマ水の働きとは

ヘチマ水の働きは何ですか?これは、美容を愛する多くの女性の友人が知りたい質問です。ヘチマ自体は比較的...

小さな雄鶏の炒め方

家庭料理はたくさんありますが、若鶏の炒め物もその一つです。料理によって調理方法が異なるだけでなく、栄...

桑の葉の副作用

桑の葉は、比較的誰にでも馴染みのあるものです。日常生活では、知らないことも多いかもしれません。桑の葉...

糖尿病患者はフェニックステールキノコを食べることができますか?

鳳凰尾茸は菌類食品の一種です。菌類食品のビタミン含有量は他の食品に比べて非常に高く、栄養価のある食品...

HPVワクチンは1回の接種で効果が出るので、3回の接種は無駄なのでしょうか?

撮影が難しく、常に人気検索リストに載っています。残念ながら、HPVワクチンほど人気のあるワクチンはあ...

王楚琴選手が3つの種目で優勝しました!様々なループボールを上手にプレイするにはどうすればいいでしょうか?

北京時間2024年3月19日、国際卓球連盟は第12週の世界ランキングリストを正式に発表し、王楚欽が3...

ブレーキの故障と走行距離の減少により、BYDの電気バス20台が返却され、米国は注文をキャンセルした。

海外メディアの報道によると、BYDの電気バスの一団が最近、米国ニューメキシコ州アルバカーキに返却され...