分類のための指標(PrecisionとRecall)の解説

PrecisionとRecallはとても単純な概念で、
「あるラベルごとの、混合行列上の行または列の上での正解率」です。
以下の図を見たほうが理解が速いでしょう。
accuracyと違うのは、これら２つの指標はラベルごとに値が存在するということです。「”りんご”のPrecision, “りんご”のRecall」などがあるということですね。

適合度(Precision)

“りんご”と予測したもののうち、実際にあたっていた割合

再現度(Recall)

“りんご”の真値のうち、ただしく予測された割合

補足

既存のweb上の文献でも、PrecisionとRecallの定義と解説は見つかるのですが、多くの場合二値分類で例示されています。
個人的には、これが理解の妨げになるのではないかと想像しています。
PrecisionやRecallは、あくまで分類の１ラベルごとに存在する概念だ、ということを覚えておくと、ややこしさが無くなりやすいと思います。

また、二値分類の際はTrue側を特にPrecisionとRecallと呼びます。

覚え方

PrecisionとRecall、どっちがどっちだっけ？となりやすいです。
私なりの覚え方を紹介します。

「適合」と「再現」という動詞の主語と目的語を考えます。

○が○に適合する
○が○を再現する

このとき、この穴に「動的なもの」と「静的なもの」を埋めるとしたら、こうなります。

「動的なもの」が「静的なもの」に適合する
「動的なもの」が「静的なもの」を再現する

文法としては「動的なもの」が主語ですが、もしも「適合度」「再現度」という割合を考えたときには、各々の分母にあたるものは

適合度の分母は、動的なもの
再現度の分母は、静的なもの

というイメージが適切であるように思います。

適合という言葉は、なにか自由に動くピースを特定の箇所にはめて、どのくらいピッタリハマったか、といった印象があります。
再現という言葉には、既に存在する静的な完成形に対して、どのくらい近づけるか、といったニュアンスがとれます。
（もしもこれが共感いただけないと、この覚え方は成立しません…諦めて暗記してください）

そして、この動的なものと静的なものは、真値と予測でいえば、当然真値が静的なもので、予測が動的なものといえます。

以上をまとめて

適合度(Precision)→適合するのは動的なもの→分母が予測
再現度(Recall)→再現したいのは静的なもの→分母が真値

という感じで私は覚えています。

F1スコア

これはPrecisionとRecallの調和平均です。両者はトレード・オフの関係にあるので、平均の数字も見ておこう、というのがこの指標の目的です。
なぜ”調和”平均なのか、というのは説明は省きます。(一言で言えば、平均を取りたい対象が割合を表す数字だからです)
補足ですが、調和平均の値は以下の図で示す分数と同じになります。

まとめ

これ以外の指標も色々ありますが、予測と真値というペアのデータが存在する以上、混合行列を起点に考えるようにすれば、迷子になりにくいのではないかと思います。お役に立てたら幸いです。

また、当然ながらこれらの指標はなんのために見るのか、ということが大事なわけですが、そういったものは既に色々探せば見つけられると思うので、探してみてください。（私なりによりよい解説が思いつけば、また記事にしようかと思います）

December 03, 2020 - posted by miyamonz

← 前の投稿

BERTのモデル構造をもう少し詳しく

次の投稿 →

AWS の session token を簡単に管理する

分類のための指標(PrecisionとRecall)の解説

指標はいろいろあって難しい

混合行列

精度(accuracy)

PrecisionとRecall

適合度(Precision)

再現度(Recall)

補足

覚え方

F1スコア

まとめ

← 前の投稿

次の投稿 →

コメントを残す

最近の投稿

タグ

アーカイブ

2026年

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年