2023-03-20

ウェルビーイングを能動的推論（自由エネルギー）の観点から提案してみたよ

新しいチャレンジ、本当に自分にできるかしら…

人生をよくしていくために必要なことは、自分の脳というものを知って上手に使っていくことです。脳を味方につければ人生は自分が考える以上に劇的に変わりますよ。

先生、脳が不安ばかり考えてしまうんです…

分からないから不安なんです。脳のメカニズムを理解すれば「今、理想と現実に落差があるからハッピーじゃないんだ」って現実を正しく捉えることができて楽な気持ちになりますよ。

先生、僕も脳のメカニズム知りたいです！

✓ 目標達成できるようになる
✓ 自信が持てるようになる
✓ 勇気が湧く
✓ 人生の目標が明確になる
✓ 毎日が楽しくなる
✓ 新しいことにどんどんチャレンジできるようになる

私たちの意識は、私たちをこんなふうにハッピーにしようと思っています。
けれども、多くの人は脳のメカニズムを知らずにアンハッピーになってしまうのです。

私たちは普段から脳内で世界に対するモデルを構築し、それに基づいて無意識にこれからのことを予測しています。予測力が高いということは、モデルをアップデートする能力が高いため人より早く先の展開も見えてしまうのです。

あなたがもっとよい状態になるためには、自分の脳のメカニズムを知り自分の人生の手綱を握っていくことが近道かもしれません。より望ましい現実を作り上げるべく自分の脳を導きましょう。

この記事は、永山晋准教授の論文（Ryan Smith氏/Lav Varshney氏/石川善樹氏/風間正弘氏/ほかとの共著※以下敬称略）を図付きで解説したものです。誤りがあれば随時更新いたします。

» International Journal of Wellbeing 掲載の論文
» 日本語解説文〈永山晋・風間正弘・石川善樹（2022.11.02）〉

能動的推論フレームワークにおける主観的ウェルビーイング

能動的推論フレームワークにおける主観的ウェルビーイング

解説文：永山晋・風間正弘・石川善樹（2022.11.02）

主観的ウェルビーイングの数理モデルを構築すべく、脳の情報処理モデル「能動的推論」 active inference model の観点からその理論的フレームワークを提案しました。このフレームワークにより、ウェルビーイングの個人差が生じる仕組みや、文化圏によって状況への感情的対処が異なる仕組みを説明できる可能性があります。また、本研究が提示する仮説の検証に向けた実験案・介入案の提案を行っています。

── ※主観的ウェルビーイングとは、簡単に言えば「よくある状態」「満たされた状態」のことで、幸福度や満足度（well-being）から測定されるものです ──

論文の4つのポイント

個人の主観的ウェルビーイングを説明する数理モデルを能動的推論の観点から提案しました。（能動的推論の説明は後述）。

数学的に得られる仮想データと、実験などで得られる実データとを合わせることで、物事を決定するための指標となる「予測」が可能となるとともに、これまでにない新しい予測や介入方法の考案に向けた反実仮想分析（あることが起こらなかったら、どうなっていたかを考えること）が可能となります。
数理モデル構築のため、ウェルビーイングの向上を期待自由エネルギー──物事がとりうる状態の中で、どの状態が一番安定であるかを示すもの──の低下と定義し、数理モデルを構成する指標を６つ仮定しました。
（１）事前信念の精度
（２）環境変動の見積もり
（３）選好の精度
（４）期待自由エネルギーの精度に関する事前信念の自信
（５）計画の展望性
（６）状態空間の粒度

この数理モデルを構成する指標とウェルビーイングとの関係についての仮説を提示しました。ウェルビーイング向上に関係する指標の組み合わせが複数ありうるため、文化圏（外部環境の特性など）によって好まれる感情が異なるなど、既存研究の異なる発見を統合的に説明できる可能性について議論しました。
提示した仮説を検証するため、モデルを構成する指標の特徴に応じた実験案・介入案を複数提案しました。

背景

近年、日本政府の骨太方針に「ウェルビーイング」という言葉が登場したように、ウェルビーイングは社会から大きな注目を浴びています。ウェルビーイングに関わる研究は、心理学、経済学、社会学の知見を取り入れながら、その測定方法、ウェルビーイングの影響要因、介入方法を多数提案・発見してきました。

これまでのウェルビーイング研究（心理学＋経済学＋社会学）▶︎能動的推論に着目

これまでのウェルビーイング研究はデータから帰納的（条件を満たすすべてのケースに対して成立することを示す方法）に主観的ウェルビーイングに関するパターンを見つけるものでした。けれども、パターンを帰納的に発見する方法では、人間の脳がなぜそのようなパターンを示すのかという原理を明らかにすることは困難です。そのため、主観的ウェルビーイングに関する理論構築が難しいという課題がありました。

そこで本研究は、脳の情報処理モデルの一つである「能動的推論 active inference」、に着目し、ウェルビーイングを説明する数理モデルの構築とその実証方法の探求を目的としました。仮に人の行動や思考の原理に迫った数理モデルを構築できれば、これまで得た異なる発見を単一のモデルで統合的に説明可能になります。また、原理からウェルビーイングに関する全く新しい予測や介入方法を提示できるとともに、数理モデルでシミュレーションすることで事前のその介入方法の反実仮想効果を検証することもできます。

能動的推論とは何か

能動的推論とは、動的にかつ不確実な外部環境と相互作用しながらエージェント（人、生物など自律的意思決定をする存在）が知覚、学習、行動の意思決定を推論することをモデル化した数学的フレームワークです。能動的推論は、エージェントを受動的に環境から感覚情報を受け取り、知覚を推論する存在ではなく、そのエージェントにとって望ましい感覚情報を得るための行動をとる存在として仮定しています。これが「能動的」推論たる所以です。

ここで、エージェントは多数の選択肢の中から、どのような基準で特定の行動、あるいは特定の知覚（潜在状態の推論）を採用するかが問題になります。能動的推論では、「変分自由エネルギー──確率的モデルがデータを生成するとき、そのモデルがどの程度良いかを表す指標──」を最小化させる「知覚」を採用し、「期待自由エネルギー──物事がとりうる状態の中で、どの状態が一番安定であるかを示すもの──」を最小化させる「行動」を採用するという仮定を置いています。

前者の変分自由エネルギーとは、選択しうる知覚のうち、観測された対象と知覚候補の誤差が小さいほど、そして、既存のモデルより変化が小さいほど、小さくなる指標です。後者の期待自由エネルギーとは、今後得られうる報酬が多いほど、そして、環境について得られうる情報が大きいほど小さくなる指標です。

本論文では、この能動的推論をウェルビーイングに応用するにあたり、ウェルビーイングが向上した状態を期待自由エネルギーを低下できた状態と定義しています。つまり、これまでよりも、将来の不確実性を削減する有用な情報を得られうる、そして、何らかの報酬が期待できる状態に移行しうることと、主観的ウェルビーイングが高まることが深く関係するものとして捉えることを意味します。

例えば、期待自由エネルギーが低下できない状況は、自分が期待する世界のモデルが、実際の世界と大きく乖離しており、そのモデルが今後改善できる見込みがない状況を意味します。これは、主観的ウェルビーイングが低い状態である自己決定感の喪失や救いようがない感覚と類似します。

モデルを構成するパラメータ（指標）とウェルビーイング向上仮説

本記事は、このように主観的ウェルビーイングの向上を期待自由エネルギーの低下と位置づけることで、能動的推論のフレームワークを反映した複数の指標で構成される数理モデルを提案しています。モデルの構成指標は以下の６つです。

（１）事前信念の精度 prior belief precision
（２）環境変動の見積もり volatility estimates
（３）選好の精度 preference precision
（４）期待自由エネルギーの精度に関する事前信念の自信 expected free energy precision
（５）計画の展望性 planing horizon
（６）状態空間の粒度 state-space granularity

これらの指標に関する説明に際し、直感的にイメージできるよう、喜びや悲しみなどの感情を推論する例を使って説明します。

（１）事前信念の精度

事前信念の制度とは、潜在状態（観測されないが推定される状態）に関する確率分布の信頼度を意味します。精度とは実際に正確なことを意味するわけではなく、様々なありうる状態の中でも特定の状態が生じる確率が高いと信じる場合（確率分布に偏りがある場合）に値が高くなります。この事前信念の精度は２種類あります。

１つは、潜在状態に対する事前信念の精度です。例えば、自分の人生に喜びの感情が湧きやすいと信じる人は（あるいは悲しみが大半と信じる場合も）、この事前信念の精度が高くなります。他方、どちらの感情が生じるかはランダム（喜びと悲しみだけの場合は半々の割合）だと信じる場合、最も精度が低くなります。

もう１つの事前信念の精度は、センサーの精度です。センサーの精度とは、観測される結果と潜在状態の対応関係の信頼度です。環境から得られる情報の信頼度に関わる信念ともいえます。例えば、食べ物が美味しいという観測が喜びの感情と強く対応している場合、センサーの精度は高い状態と捉えられます。ウェルビーイング向上において、エージェントの置かれている環境の不確実性などによって、この事前信念の精度の最適値は変わると考えられます。

（２）環境変動の見積もり

他方、環境変動を高いと見積もることは、新しい観測を得るたびに、その情報をもとにこれまでの信念を大きく更新することを意味します。つまり、環境変動の見積もりは学習率と関係します。

環境が安定しているとは、カレーを食べるとおいしいという体験をし、喜びの感情が湧くといった関係性が、繰り返し起こると見積もることです。

他方、周囲にカレーの味が安定しないお店しかなければ、カレーを食べたところで喜びの感情を得られるかは分かりません。

なお、環境変動の見積もりは、これまで学習した信念を時間変化に応じてどれだけ推論に寄与させるかという忘却率でも表現できます。

（３）選好の精度

他方、喜びも悲しみも同程度の好みの場合（偏りがない場合）、選好の精度が低くなります。この選好の精度は、今後の行動を左右する情報探索と報酬獲得のバランスに関係します。例えば、先の例に挙げたように感情の選好に対する精度が高い場合（喜びを好む）、喜びをもたらす行動を毎回繰り返します。他方で、行動の多様性が抑制されるため、新しい情報を得ることができません。そのため、選好の精度が高い場合、衝動的な報酬追求行動が見られることが予測できます。

一定の探索がなければ最適な行動を発見できない一方、いつまでも探索的な行動をとっていては、大きな報酬を得られません。それゆえ、選好の精度は中程度である際にウェルビーイングが高くなることが予想されます。

（４）期待自由エネルギーの精度

期待自由エネルギーの精度とは、エージェントのモデルに対する自信や信頼性を表しており、行動選択において期待自由エネルギーの量にどれだけ影響を受けるかを意味します。この精度が高いことは、自分の行う行動が、有用な情報や高い報酬獲得に結びつきやすいという確信が高い状態です。自分のモデルに対する評価に関わるため、メタ認知とも深く関係します。

この値が高いほど、行動のランダム性や習慣による行動支配の影響が低減します。

例えば、カレーを食べるという行動が、美味しいという体験と、好ましい感情としての喜びをもたらすと確信している場合、期待自由エネルギーの精度が高いことが予想されます。期待自由エネルギーの精度が高いほどウェルビーイングが高いことが予想されます。

（５）計画の展望性

計画の展望性とは、エージェントが先々のステップを見通している程度を意味します。ここで仮定しているエージェントは、自分のモデルをもとに、何らかの行動をとって得られる報酬と情報の期待値を計算します。ある行動をとることで別の状態に遷移（せんい）し、その際にまた何らかの行動をとった場合に得られる報酬と情報といったように、現時点から先々の時点で報酬と情報の期待される累積獲得量を計算するエージェントもいれば、直近の時点までしか計算しないエージェントもいるでしょう。

計画の展望性が高い場合、最終的に大きな喜びの感情を得るために一時的に好ましくない悲しみの感情を経る状況を受け入れられます。

ただし、環境が不安定である場合、先々のことを考えたばかりに直近の報酬を見逃す場合もあります。そのため、計画の展望性は、置かれている環境に応じて柔軟に変化できる場合、高いウェルビーイングがもたらされることが予想されます。

（６）状態空間の粒度

状態空間の粒度とは、エージェントがもつ潜在状態の粒度を意味します。自分の感情を潜在状態とした場合、多様な感情概念を知覚できる場合、状態空間の粒度が高い（きめ細かい）ことを意味します。例えば、喜びと悲しみのみの単純な感情概念の知覚は低い粒度であり、強い喜びと弱い喜び、強い悲しみと弱い悲しみのような感情概念を知覚できる場合は、より高い粒度といえます。

潜在状態の粒度が高いほど、より正確な潜在状態の推論が可能となるうえ、行動のガイドとなるより豊かな情報をそのモデルから得られます。ただし、エージェントが置かれている環境によっては、低い粒度でも現実世界との齟齬が大きくならない場合もあります。その場合は、粒度が高いことが必ずしもウェルビーイングを高めるとは限らないため、最適な潜在状態の粒度は環境特性に依存すると考えられます。

これらの指標の構成とウェルビーイングの仮説を整理したものが、図1です。

ここまでの説明からも推察されるように、ウェルビーイングを向上させる方法は一様ではありません。エージェントが置かれている環境特性に応じて、ある指標は高く、異なる指標は低い場合にウェルビーイングが高まるといった組み合わせが複数あると考えられます。

ウェルビーイングの既存研究においても、例えば、米国は強いポジティブな感情、日本は弱いネガティブな感情を好みやすいといった文化圏に応じて好まれる感情が異なることが知られています。このような既存研究で指摘された異なる発見に対し、本論文で提案した数理モデルのフレームワークが統合的に説明できる可能性があります。

図1. 主観的ウェルビーイングの計算論的フレームワーク

↑※モデルを構成するパラメーターは青字

仮説検証に向けた実験案・介入案

最後に、提示したモデルの指標をどのようにして推定するかが問題になります。そのため、本論文では、表2に整理されている通り、実データを使ってモデルの各指標を推定するための実験案・被験者への介入案について提案しています。6つのパラメータを同時に推定するというよりは、モデルの各指標の特性に応じた実験案を過去の研究のアプローチを参照しながら提案しています。

なお、ここで提示している指標は、潜在変数（直接的には観測できないが、間接的に影響を与える変数）と呼ばれる実データから直接観測不能の変数です。この潜在変数の推定にあたり、設定した数理モデルから生成される仮想データと、実験などで得た実データとを近接する指標を機械学習の手法を使って推定するなどの方法をとります。

今後の期待

本研究が提示した実験案に限らず、今後、提示された仮説の実証が期待されるとともに、数理モデルに踏み込んだウェルビーイング研究が進展していくことが期待されます。また、数理モデルによって、ウェルビーイングの説明に関わる全く新しい仮説や測定方法の提案、ウェルビーイング向上の介入案が考案される可能性が広がります。

さらに期待できることは、能動的推論の他分野への応用です。能動的推論はロボット工学などにも応用が広がっていますが、社会科学への応用はまだ限られています。そのため、本研究の一連の議論に触発され、能動的推論が経済学分野や経営学分野などに応用が広がっていくことも期待されます。

著者

研究支援：本研究は、公益財団法人Well-being for Planet Earth、the William K. Warren Foundation、the National Institute of Mental Health (R01MH123691; R01MH127225)、the National Institute of General Medical Sciences (P20GM121312)、JSPS科研費 (19H01527)から支援を受けています。

使用論文：能動的推論フレームワークにおける主観的ウェルビーイング

投稿を観覧した人数: 200

	ウェルビーイングのための新たな知見「バランス/調和」

	幸福を深く理解しましょう

	【職場のウェルビーイング】世界最大の研究から得た洞察

	あなたは子どもの主観的ウェルビーイングを理解していますか？

	子どもと青少年の幸福：世界のトレンドと課題

ウェルビーイングを能動的推論（自由エネルギー）の観点から提案してみたよ

能動的推論フレームワークにおける主観的ウェルビーイング

論文の4つのポイント

背景

能動的推論とは何か