優秀な機械学習の専門家はバイアスとバリアンスをよく理解しています概念を学ぶのは簡単ですがマスターするのは難しいものですもしバイアスとバリアンスを知っていても　新たに学ぶことは多いでしょう深層学習においてあまり議論されていないことがありますバイアスとバリアンスのトレードオフですこの言葉を聞いたことがあるかもしれませんしかし深層学習ではトレードオフは少ないのですしたがってバイアスをやりバリアンスもやらねばなりませんがトレードオフにはあまり触れませんそれが意味するところを見てみましょうこのデータセットを見てください直線をあてはめてみましょうロジスティック回帰であてはめてみますデータにうまく適合していませんよってこれは高バイアスだと言えますデータにアンダーフィットしています反対に非常に複雑な分類機を用いると例えば深層ニューラルネットワークや大量の隠れユニットを持つニューラルネットではおそらく完璧なあてはめを得られるでしょうがこれもまた良いあてはめには思えません高バリアンスな分類器でオーバーフィッティングしていますそしてこれらの中間の分類器があるはずです中程度の複雑さのこのようにあてはめられますこれは合理的なあてはめのように思われますぴったり適している中間の分類器といえますこのような２次元の例では２つの特徴量をもち X1とX2を描いてバイアスとバリアンスを視覚化できます高次元の問題においてはデータを描き分類境界を視覚化できませんそのかわりいくつか方法を説明しますバイアスとバリアンスを理解するためのものです引き続き猫写真の分類を用いましょう左が正例右が負例ですバイアスとバリアンスを理解する２つの重要な数字は訓練セット誤差と開発セット誤差です例をあげて説明しましょうあなたには写真中の猫がわかるほぼ完璧に判別できるでしょう？訓練セット誤差は１％で開発セット誤差はたとえば 11％としてみましょうこの例においてあなたは訓練セットではよくやりましたが開発セットではあまりうまくいきませんでした訓練セットにオーバーフィットしたようですうまく汎化できなかったようです開発セット内の交差検定セットに対してしたがってこのような例では高バリアンスだと言えるでしょう訓練セット誤差と開発セット誤差を見ることにより高バリアンスだと判断できるのですここで訓練セット誤差と開発セット誤差を測定し異なる結果が得られたとしましょう訓練セット誤差が15％で訓練セット誤差を上の行に書きます開発セット誤差が16％です人間の誤差はほぼ０％だと仮定しましょう人間は写真を見て猫かどうかわかるということです訓練セットであまりうまくいっていないようですもし訓練データでさえ良くないならばアンダーフィッティングしていますこの方式は高バイアスです一方で開発セットに対する一般化は十分です性能差はわずか１％なのですからこの方式は高バイアスの問題ですなぜなら訓練セットでさえ適合しないのですからこれは前のスライドの左端の図と似ていますここで別の例にいきます訓練セット誤差が15％だとしましょう非常に高バイアスですしかし開発セットで評価するとさらに悪く 30％になりましたこの場合高バイアスだと判断します訓練セットでさえダメでさらに高バリアンスです最悪です最後の例として 0.5％の訓練セット誤差と１％の開発セット誤差だとしますユーザーはとても満足でしょうたった１％の猫分類器が得られたのですからこれが低バイアスと低バリアンスです細かいことですが大まかに説明します後のビデオで詳しく議論しますがこの分析はある仮定においての予測です人間であれば誤差がほぼ０％であるという一般的にいえば理想的な誤差がベイズ誤差とも呼ばれますがベイズ理想誤差がほぼ０％の場合ですこのビデオで詳細には立ち入りませんが理想誤差・ベイズ誤差がもっと大きいならばもし15％ならばこの分類器は 15％は訓練セットに対してまったく妥当であり高バイアスではなく低バリアンスでしょうバイアスとバリアンスを分析する際にどの分類器でもうまくいかない場合たとえばとてもぼやけた画像の場合人間であれ機械であれうまくいかないであろう場合ベイズ誤差はとても大きくなりこの分析の細部が変わりますここの細かいところは置いておいて大事なことは訓練セット誤差からあてはめの感じをつかんであくまで訓練セットに対するあてはめですがバイアスの問題がわかりますそして誤差の悪化を見れば訓練セットから開発セットでの悪化を見ればバリアンス問題の感じがつかめます訓練セットから開発セットへ汎化してみればバリアンスの感じがわかりますこれらはベイズ誤差が小さいという前提での話です訓練・開発セットが同じ分布から得られたという前提もありますこれらの前提が崩れた場合もう少し込み入った分析がありますが後のビデオで話しますでは前のスライドで高バイアスを見ました高バリアンスも見ました良い分類の様子もつかめたと思います高バイアスで高バリアンスの時はどうでしょうか？両方の点で悪い場合です分類器はこのようになるのでした線形分類器は高バイアスですアンダーフィットするためですこの分類器はほぼ線形でアンダーフィットします紫で描くことにしますしかし分類器に奇妙な性質があればデータの一部にはオーバーフィットします紫で描いた分類器は高バイアスと高バリアンスです高バイアスである理由はほとんど線形分類器であるからでうまく分類できていませんこの２次曲線ならうまくいくのですが中央で過多な自由度を持つためにこれらの点にとらわれてしまいオーバーフィットしてしまいますこの分類器はほぼ線形のため高バイアスですが必要なのは２次曲線でしょうそして高バイアスの理由は自由度が高すぎて間違った２点に合ってしまったからです中央の外れ値にあてはまってしまったのですこの場合はなんとかやれましたこの例は２次元なのでやれましたしかし入力がとても高次元のときこんな事態に遭遇するでしょう高バイアスの領域と低バイアスの領域がありこのような分類器になりえます高次元の入力でより対処しにくいでしょうまとめると訓練誤差と開発誤差を見て分析を試みることができます高バイアスの問題か高バリアンスの問題かあるいは両方かどちらでもないかバイアスとバリアンスのどちらが問題かによってやるべきことは異なるでしょう次のビデオで紹介したいのは機械学習の基礎レシピと呼んでいるより系統だって改善する方法で高バイアスか高バリアンスかによって対処しますでは次のビデオにいきましょう