深層学習という用語は ニューラルネットワークに学習させることを意味します 時に非常に大きなニューラルネットワークを対象にします ではニューラルネットワークとは 一体何なのでしょうか このビデオでは基本的で 直感的なところを身につけてもらいます 住宅価格を予測する例から 見てみましょう 6件の住宅のデータセットがあります 平方フィートや平方メートルで 広さが分かります 住宅の価格もわかります 広さの関数で住宅価格を 予測するようにフィッティングさせたいとします 線形回帰を知っていれば このデータに 直線を引こうとするでしょう このような直線を引きましょう 少し変わっています 価格はマイナスには ならないでしょう マイナスになってしまう直線で フィッティングするのではなく ここで曲げましょう ここで0になるようにします この青の線が関数です 広さによって住宅価格を 予測する関数です ここは0でそこより右は 直線でフィッティングしています この住宅価格にフィッティングさせた関数を とてもシンプルな ニューラルネットワークと考えてください 最もシンプルなニューラルネットワークです ここに書きます ニューラルネットワークの入力に x と呼ぶ住宅の広さがあります この円で示したノードに 入っていきます そしてy と呼ぶ価格を出力します この小さな円は ニューラルネットワークの小さなニューロンです 円は左に描いた関数を 実装しています ここでニューロンが行っているのは 広さを入力し線形関数を計算し 0を引数に持つmax を返し 予測した価格を出力しているだけです ところでニューラルネットワークに関する文献では この関数をよく目にします この関数は0がしばらく続き その後直線で昇っていきます この関数はReLU と呼ばれ 次の略語です Rectified Linear Units. R-E-L-U です R は0を引数にもつmax を計算するということで このため関数はこのような形になります ReLU 部分は今は気にしないでください このコースで再度触れるものと捉えてください これがひとつのニューラルネットワークとすれば 本当に小さなニューラルネットワークですが より大きなニューラルネットワークというのは 1つ1つの小さなニューロンを使い 積み重ねたものです このニューロンを1つのレゴのブロックと考えれば 多くのブロックを積み重ねれば より大きなニューラルネットワークができます 例を見てみましょう。 例えば広さだけを手掛かりに 住宅価格を予測するのではなく 他の特徴を使うとします 例えば寝室の数以外の住宅の特徴もわかります sを付けるべきでした 住宅価格を決めるものの1つに 家族の人数があると考えるでしょう 住宅には3人、4人 5人などで住めます よね? 平方メートルなどの広さと 寝室の数こそが ある人数の家族が その住宅に住めるかを決めます そのほかにZIP コードがあります 国によっては郵便番号と呼ばれています ZIP コードによって徒歩が可能な地域かどうかが 分かるかもしれません 徒歩で行動できる地域でしょうか 食料品店や学校まで歩ける 地域か? 車が必要かどうか 徒歩で行動できる地域を好む人もいます ZIP コードとともに 裕福さが アメリカでも他の国でもですが 学校の質の高さを決めます この小さな円はそれぞれが ReLU になりえます Rectified Linear Units か どちらかというと非線形関数にもなりえます まとめると広さと寝室の数から 家族の人数が分かり ZIP コードから徒歩行動の可否が分かり ZIP コードと裕福さから学校の質が分かります そして人が住宅にいくらまで支払うかは 本当に重要と考える要素によって 決まると考えるでしょう この場合には家族の人数、徒歩行動の可否、学校の質をもとに 価格を予測しようとします この例ではx はこれらの4つの入力で y は予測しようとする価格です 先のスライドで見たニューロン または予測因子を重ねることで 少しだけ大きなニューラルネットワークができました 強力な魔法のようですが ニューラルネットワークを実装するときには 入力にはx と出力のy だけを使い トレーニングセットに使用し 中間のものは 自ら勝手に決まります 実際に実装するのはこれです ここに4つの入力を持つ ニューラルネットワークがあります 入力の特徴量は広さ、寝室の数 郵便番号、地域の裕福さです これらの入力の特徴量を与えると ニューラルネットワークの仕事は 価格のy を予測することです よく見てください この部分の小さな円はニューラルネットワークでは 隠れユニットと呼ばれ 入力特徴量の4つ全てを入力します 例えばこの1つ目のノードはX1とX2の特徴量のみから 家族の人数を表すというのではなく ニューラルネットワークに対して 自らこのノードの表すものを決めさせます このため4つの特徴量をすべて渡し 自由に計算させます ニューラルネットワークの 入力の層と中間の層を 密に接続されていると言います 全ての入力特徴量は中間のすべての円に 接続されているからです ニューラルネットワークの素晴らしいところは xとyに関する十分なデータを与えると 十分な学習データをxとyで与えると ニューラルネットワークは 正確にxからyを割り出す関数を 非常に上手に探し出します これがニューラルネットワークの基本です 自分自身でニューラルネットワークを作ることで 教師あり学習では最も便利で 強力なものと恐らく思われたでしょう 入力xを使って出力のyに 割り当てようとしました 住宅価格の予測の例で見たようにです 次のビデオでは さらに教師あり学習の例を見てみましょう これらの例では作るニューラルネットワークが 適用例に驚異的に役立つと思われるかも しれません