交渉で心を読むための能力向上AIエージェント開発 岐阜大学

多様な価値観を認めあう社会の実現に向けて

 岐阜大学の寺田和憲教授、佐藤幹晃(博士前期課程2年)らのグループは24日、南カリフォルニア大学のJonathan Gratch教授との国際共同研究により、交渉において心を読む能力を向上させるAIエージェントを開発したと発表した。
 交渉の成功に重要な心の状態の一つである相手の選好(価値観の相対化によって得られる順序関係)を読む能力を向上させるためのAIエージェントシステムを開発し、成人を対象としてその有効性を示したもの。
 多くの人にとって交渉は難易度の高い社会的相互作用である。そのため、例えば、給与交渉が収入を向上させる可能性を持つにもかかわらず、多くの人が給与交渉をせずに提示された給与をそのまま受け入れていることが知られている。
 また、交渉への消極性が経済的不平等や賃金停滞を助長する一因となっている可能性も指摘されており、交渉能力の向上は社会的課題であると言える。
 一般的に、交渉ではWin-Winの関係になれる可能性があるが、そのためには、複数ある論点に対する選好を相互に正確に見極め、資源の分配を最適化する必要がある。選好は直接観察できない心の状態であるため知ることは容易ではない。人は、日常的に、直接観察可能な相手の行動や表情から相手の選好を推論しているが、交渉においては、相手の選好が自分と一致しているという固定パイバイアスなどの様々な認知バイアスが選好の推論を困難にしており、認知バイアスの克服が課題となっていた。
 こうした中、同研究グループは、人の感情が個人の選好に基づいた状況評価の結果により表出されるという評価理論(appraisal theory)に基づいて設計した感情評価生成モデルをAIエージェントに搭載した。評価プロセスを視覚的に明示し、ユーザに言語的フィードバックを与えながらシンプルな交渉タスクを行うことで、選好と表出感情の対応関係のモデルを用いて選好を推論する方法を学び、選好を読む能力を向上させるシステムを開発した。
 また、成人187人を対象とした実験の結果、提案方法によって、選好を読む能力が向上することを確認した。
 同研究グループは、高ウェルビーイング社会の実現のためには、社会構成員が相互に相手の心を読むことによって他者の多様な価値を認め、資源やタスクの分配を数理的に最適化する能力(数理的社会情動能力)を持つことが重要だと考えている。
 今後は、同研究成果を発展させ、道徳と算数をハイブリッドした教育プログラムをAIエージェントとのインタラクションに実装することで、コミュニケーションに課題を抱える子どもたちも含めた、社会の未来を担う多くの子どもたちが、相手の心情を理解し、多様な価値観を尊重し、複雑な人関関係にうまく対応する能力を獲得できるシステムを開発する予定である。
 なお、これらの研究成果は、22日に科学誌「IEEE Transactions on Affective Computing」のオンライン版で公開された。

 交渉は、日常生活のあらゆる場面に存在する。国家間の対立から、家族の夏休みの過ごし方をめぐる議論に至るまで、争い事は、可能な解決策を検討し議論すること、つまり交渉により解決できる可能性が高まる。交渉には複数の論点があり、論点に対する価値観や選好は人によって異なる。従って、交渉においてWin-Winの合意に至るためには、怒りにまかせて対立するのではなく、自他の選好の一致・不一致を正確に見極めて、資源の分配を最適化する必要がある。
 交渉者は、会話から相手の好みを聞き出すなど明示的な情報交換を通じて相手の選好を知ることもできるが、非言語的な手がかり、特に感情表現を観察することによっても判る。
 人のWin-Winの合意を阻害する認知バイアスとして、固定パイバイアス、アンカリング、過信などが知られている。認知バイアスの克服のためには交渉中に交換される情報から正しく相手の選好や限界をデコードすることが鍵となる。
 なお、交渉における重要な数学的なパラメータである選好と限界は主観的に決まるという問題があるが、心理学の方法による数値化により、ある程度客観性を保って扱うことが可能になる。感情は人の状況に対する評価(appraisal)をエンコードしているために、逆評価(reverse appraisal)を用いて相手の選好をデコードすることができる。 逆評価は合理的エージェントの生成モデルを尤度(ゆうど)として用いたベイズ推論によって実現可能だ。
 交渉術を教えられる機会はほとんどないが、米国科学アカデミーから世界経済フォーラムに至るまで、交渉術のトレーニングを進めるためのイノベーションを呼びかけている。AIエージェントを用いた交渉トレーニングシステムはこれまでに提案されているが、フィードバックの与え方などが重視されており、人の感情の認知計算過程は考慮されていなかった。
 そこで、同研究グループでは、評価理論(appraisal theory)に基づいて設計した感情評価生成モデルをAIエージェントに搭載し、評価プロセスを視覚的に明示し、言語的フィードバックを与えることで、人に生成モデルの理解と学習を促し、逆評価の方法をトレーニングするシステムを開発した。
 交渉において、相手の心(選好)を読む能力を向上させられるかどうか、またWin-Win合意に至る能力を向上させられるかどうかを検証した。提案するシステムは、選好を読む能力向上を目的とした世界初のトレーニングシステムだ。評価理論に基づく人の感情の認知過程の計算モデルを搭載したAIエージェントの導入により開発が可能になった。

図1 感情の逆評価による選好の推論をトレーニングするインタフェース。キャラクターひよりは株式会社Live2Dの著作物である。このタスクでは2種類のスイーツ(この例ではドーナツと柏餅)それぞれ2個を実験参加者とひよりで分配します。実験参加者は、ひよりと実験参加者のスイーツの好みが、分配的な交渉の場合一致(利害が対立)、互換的な交渉の場合は正反対(完全にWin-Winになれる)、統合的交渉では部分的に一致しているという設定で交渉を経験する。

 同研究グループが提案する感情の逆評価による選好の推論をトレーニングするインタフェースを図1に示す。ユーザは、このインタフェースを使って、複数種類のスイーツを分配する交渉タスク(複数論点最後通牒ゲームをAIエージェント(ひより:キャラクターひよりは株式会社Live2Dの著作物です)と行う。
 ユーザは、分配を決定し、提案する。提案は、一度だけ行うことができる。AIエージェントは分配が気に入らなかったら拒否する。相手に拒否されると、ユーザも相手もスイーツは一切得られない。従って、このタスクはAIエージェントの拒否の限界を見極めつつ自分も満足する配分を探索するタスクと言える。
 交渉は、シンプルな2論点(スイーツ2種類)で、分配的交渉、互換的交渉の2つの極端な交渉と、より一般的な統合的交渉の合計3つの交渉を経験する。ユーザがスライダーバーを操作すると、2次元グラフ上で、現在の分配状況を示す点が移動し、自他の効用(総合利益)を逐次に確認できる。
 2次元グラフにはAIエージェントの効用と感情表出の対応を可視化した感情評価過程を表すヒートマップが重ねられている。また、AIエージェントはヒートマップの数値に応じた表情を表出する。表情は、スイーツが好きな度合いと、自分に割り当てられるスイーツの量のかけ算によって計算される効用を使って表す。交渉を成立させるためには、このかけ算の結果がAIの許容度を超えない範囲になるようにしなければならない。
 具体的には、表情は効用u=w・x 使って式(1)に従って表出される。wは、スイーツの種類に対する重み、すなわちそのスイーツがどれぐらい好きかを表すベクトルはその時点で自分に割り当てられているスイーツの個数を表すベクトルである。limit はそれ以下の数値であればAIが提案を拒否する限界である。

 さらに、AIエージェントはテキストによって分配状況の意味を説明するフィードバックを与える。これらを経験することで、ユーザは分配、効用、表出感情の対応関係である評価過程を学ぶことができる。この評価過程の学習によって、観測した表情だけから逆に選好を推論することができるようになると考えられる。

図2 交渉パフォーマンス、選好推論性能を測定するために用いたインタフェース

 このトレーニングインタフェースの有効性を検証するためのオンライン実験を187人(平均年齢46.9歳、男性70%)の参加者を対象に実施し、すべての参加者に4論点(スイーツ4種類)の交渉(複数論点最後通牒ゲーム)を2回行ってもらった(用いたインタフェースは図2参照)。
 実験では、参加者をトレーニング経験群(2回の交渉の間にトレーニングインタフェースを使った選好推論トレーニングを行うグループ)と、トレーニングを行わない非経験群に分けた。さらに、それぞれ1回目の4論点交渉に比べて2回目の4論点交渉のパフォーマンスと選好推論の正確さが向上しているかどうかを測定した。
 分析の結果、トレーニング経験群にのみ選好推定性能の向上が見られ、トレーニングインタフェースが選好推定能力の向上に有効であることが確認された(図3d)。これは、実験参加者がトレーニングインタフェースの使用により、交渉中に交換される非言語情報から正しく相手の選好をデコードする能力(相手の心情を読み取る能力)を向上させたことを示唆する。
 交渉のパフォーマンスについては、共同利益を減ずることなく、自分の利益を低く、相手の利益を高くするようになることが確認された(図3a、3b、3c)。

図3 実験結果。(a)、(b)、(c)は交渉パフォーマンス。(d)は選好推論性能。

 同研究グループの提案するAIエージェントとのインタラクションで交渉スキルが向上すれば、共同利益の向上により、人々のウェルビーイングが向上する可能性がある。それだけでなく、相手の選好や価値観の読み取り能力の向上によって、単一の価値観にとらわれることなく、個人の選好に従った資源の分配や適材適所の人やタスクの配置が可能になり、ウェルビーイングの高い社会の実現が期待される。
 また、他者の選好の正確な理解は対立の解決に寄与する。双方で重視する論点が異なる可能性があるからだ。国家間の対立から、家族の夏休みの過ごし方の議論に至るまで、選好の正確な推論に基づきWin-Winの解を見出す能力は対立を解消し、人々のウェルビーイングを高めることが期待される。
 今後は、同研究成果を応用し、道徳と算数をハイブリッドした教育プログラムをAIエージェントとのインタラクションの中に実装することで、コミュニケーションに課題を抱える子どもたちも含めた、社会の未来を担う多くの子どもたちが、相手の心情を理解し、多様な価値観を尊重し、複雑な人関関係にうまく対応する能力を獲得できるシステムを開発する予定である。

タイトルとURLをコピーしました