ENGINEERING

姿勢推定AIはすべて同じ?知っておくべき姿勢推定の違い。

姿勢推定AIとは?

姿勢推定AIとは主に、人が写っている写真や動画から、その人の姿勢を検知してくれるAIです。一般的に多く使われるのが、下の写真のような、画像上の関節の位置を検出するものです。

こんな風に、画像だけでどんな姿勢をしているかが分かればとても便利ですよね?例えば、筆者もよく姿勢が悪いと言われますが、どこがどのくらい悪いのか、数値化をするのはとても難しいです。そんな時この姿勢推定AIがあれば簡単に数値化してくれます。

では、どんな数値が得られるのでしょうか?最初に得られるのは画像上のどのピクセルに関節があるかという座標情報(X,Y)です。さらに点と点を結んだ時の角度も計算することができます。

このように二次元上の点から角度計算をするのが姿勢推定AIで最も一般的なものです。しかし、果たしてこれで姿勢を正しく評価できるのかというと注意が必要です。

この方法は二次元的な方法のため、例えば斜め方向から撮影した関節の角度を正確に知ることはできません。もう一度スキーの画像を見てましょう。

右膝はおおよそ真横から写っているかもしれませんが、股関節や肩、肘の関節はどうでしょう?さきほどの方法で角度を計算した時、正しい角度が算出されるでしょうか?答えはノーでこの方法は体が斜めを向いているときは使えません。そのため、二次元姿勢推定AIを使ったサービスは正面や真横から撮影することが基本となります。

三次元姿勢推定AI

二次元姿勢推定では三次元的な関節の角度を求めることは難しいです。しかし、世の中には二次元画像から三次元的な関節の位置まで推定するAIもあります。その出力は下図のようになります。

3D human body pose diagram. | Download Scientific Diagram

このような手法では、関節位置の奥行きまで推定し、三次元での角度計算も可能となります。これで斜めに写っている体の関節角度も算出が可能になるでしょう。しかし、この方法も完璧とは言えません。なぜなら人体が再現可能な姿勢かはまた別の問題だからです。下図はOpenSimという筋骨格シミュレーション用のモデルで、このような人体モデルを当てはめて、内部の関節角度パラメーターを取得することでより正確な関節角度を求めていきます。

さらに、三次元姿勢推定ができたとしても、多くの場合は骨盤を解析することができず、体の傾きや歩行/走行の速さなども算出できません。

グローバル空間での三次元姿勢推定

グローバル空間とは例えば上の画像の赤(X)・緑(Y)・青(Z)の線が交わる点を原点(X,Y,Z=0,0,0)とした空間を言います。1m前方に進めば、骨盤のX座標はX=1となります。しかし、もう一度述べると、三次元姿勢推定でもグローバル空間上で解析ができなければ、こういった解析ができません。ORGOのMYoACTはタブレットやスマートフォン一つであらゆる解析を可能とすることを目標にしており、グローバル空間上での三次元姿勢推定を可能にしています。下図はスマートフォンで撮影した歩行動画から、グローバル空間上での三次元姿勢推定を行ったものになります。

グローバル空間上での解析を可能にすることで、歩行においては歩幅、歩行速度、重心の軌跡、ふらつきまで解析が可能となり、動作の解析にとって重要なパラメーターの多くを算出できるようになります。また、上の画像から分かるように、床面上を歩いている状態を正しく推定できていることが分かります。床反力の推定や、筋活動の計算といった先進的な解析も、グローバル空間上での三次元姿勢推定が行えることで可能になっています。

まとめ

姿勢推定AIはとても便利なツールです。しかし、姿勢推定AIが全て同じものではありません。簡易的なものから、高額なモーションキャプチャーに匹敵するような、もしくはそれを上回る機能を提供するサービスまで存在します。姿勢推定AIに興味をお持ちの方は、そのサービスでどんな解析が可能か、よく確認してから使用することをおすすめします。

記事を書いた人

上野亮 / 執行役員

北海道大学大学院にて理学療法士および保健科学博士を取得。その後、米国Mayo Clinicおよびオーストリア国インスブルック大学でポスドク研究員として勤務し、筋骨格モデルを使ったバイオメカニクス解析に関する研究を行う。株式会社ORGO入社後、研究プロジェクトの総括を行う。