ニューラルネットワークは 大げさに表現されているところがあります ニューラルネットワークが効果的に動作することを考えると 大げさとも言えないものもあります ただニューラルネットワークで 作られた経済的価値のほとんどは 教師あり学習という種類の 機械学習の手法でもたらされています 教師あり学習とは何なのか 例を見てみましょう 教師あり学習では 入力のx があり 出力のy が割り当たるような関数を求めるものです 例えばここでは住宅価格を 予測するアプリケーションを見たところです 住宅の特徴を入力することで 価格y を出力または予測します これから紹介する例では ニューラルネットワークが適用され効果的に 学習しました。 こんにちの深層学習で 最も利益の出る適用例は 最も刺激的ではないかもしれませんが 利益が出るのはオンライン広告です オンライン広告ではユーザーの情報と 候補の広告の情報を入力することで ニューラルネットワークは ユーザーが広告をクリックするかどうかを かなり正確に予測できるようになりました そして ユーザーに最もクリックしそうな広告を表示することは ある企業群では信じられないほど利益を生む ニューラルネットワークの適用例となっています というのも最もクリックしそうな広告を 表示することができることは オンライン広告を行う巨大企業にとって 収益を左右する直接的な影響があるからです コンピュータービジョンもまた その多くが深層学習によって ここ数年で大きな進歩を遂げました ここでは画像を入力して 何の画像か示す画像番号を出力します 例えば1から1,000までの番号で その画像がどの画像が示されます 1,000個の異なる画像のどれかを示します 写真をタグ付けするのにも使えます 音声認識の最近の進歩も とても刺激的です ニューラルネットワークに 音声ファイルを入力すると 音声のテキストが出力されます 深層学習のおかげで 機械翻訳も大きな進歩を遂げました ニューラルネットワークに英語の文を入力すれば 出力として 中国語の文を出せます 自動運転ではレーダー情報や 車の前方の画像を入力することで 周りの車の位置を教えてくれるように ニューラルネットワークに 学習させることができます 自動運転システムの鍵となる部品となりました つまり特定の問題に対して 賢明にx とy を選択し この教師あり学習の部品を 例えば自動運転車のような より大きなシステムに適合させます ニューラルネットワークで創造される価値の多くは このようなところから生じています 様々な適用先に対して 少しずつ異なる種類のニューラルネットワークが 役立つとわかってきました 例えば 先ほどのビデオで見た 不動産の適用例では 普遍的で標準的なニューラルネットワークの アーキテクチャーを使用しました 不動産でもオンライン広告でも 見てきたように 比較的標準的なニューラルネットワークを使います 画像への適用では 畳みこみニューラルネットワークを使用することが多く CNN とよく略されます シーケンスデータでは 例えば音には一時的な側面があります 音は時とともに再生されるもので ごく必然的に 1次元の時系列データまたは 1次元の一時的なものの連続で表されます シーケンスデータには RNNをよく使います 再帰型ニューラルネットワークです 英語や中国語などの言語ではアルファベットか語が 1つずつ使われます このため言語も必然的にシーケンスデータで表されます これらの適用例では より複雑な形態のRNN がよく使われます 自動運転車のように さらに複雑な適用例では 画像に対してはCNN 畳み込みニューラルネットワークの構造が推奨され レーダーに対しては全く異なるものが必要です これには特別に作られた より複雑で 複合的に組み合わされた ニューラルネットワーク構造を使うかもしれません もう少し具体的に 標準的なCNN やRNN の構造を 見てみましょう 書籍などでこんな画像を 見たことがあるでしょうか これが標準的なニューラルネットです このような画像をみたかと思います そしてこれが畳み込みニューラルネットワークの例です 今後のコースで画像が意味するものと どうやって作るかを学びます 畳み込みネットワークは 画像データによく使われます この画像も見たことがあるかもしれません 今後のコースで どう作るのか学びます 再帰型ニューラルネットワークは 時系列的な要素を持つような 1次元のシーケンスデータに特に有効です 機械学習を構造化データと 非構造化データの両方に 適用できると聞いたかもしれません これがその用語の意味です 構造化データは 基本的にデータベースのデータです 例えば住宅価格の予測では データベースがあり 列が住宅の面積や寝室の数を示します これが構造化データです またユーザーが広告をクリックするかの予測では 年齢などのユーザーの情報や 広告の情報があり 予測しようとするラベルのy があります これが構造化データで 特徴のそれぞれが十分に定義されています 例えば家の面積や寝室の数や ユーザーの年齢などです 対照的に 非構造化データが指すのは 音や画像で 画像や文字が何かを認識することが目的になることがあります この例では画像の画素の値や 文字の一部の語が 特徴量となるでしょう 歴史的にコンピューターにとっては 非構造化データの方が構造化データよりも 理解が困難でした 人類は画像や音の手がかりの理解を 非常に上手くできるように 進化しました 文字はより最近の発明ですが 人類は非構造化データを 非常にうまく理解するのです 深層学習やニューラルネットワークのおかげで この進化で最も刺激的なもののひとつは 数年前に比べてコンピューターが非構造化データを かなり上手に理解できるようになったことです このおかげで多くの刺激的なことに 新たに適用できるようになりました 音声認識、画像認識、文字の自然言語処理などの用途です ほんの2~3年前と比べても かなりのことができるようになっています 非構造化データが理解できることには 自然に感情移入してしまうため メディアでは非構造化データに対する ニューラルネットワークの成功例をよく聞くかもしれません ニューラルネットワークが猫を認識できることは ただただ凄いことだからです みんなが好ましい進歩だと思いますし どんな意味を持つかを知っています しかしニューラルネットワークがもたらす 短期的な経済的価値の創造は 構造化データに関するものが多いです かなり効率的になった広告システムや 利益を最大化する推薦システムや 多くの企業が正確な予測を行うために持つ 巨大なデータベースを 処理できるような より強力な能力に関するものです このコースでは多くの方法を紹介しますが これは構造化データ 非構造化データの両方に適用できます アルゴリズムを説明する目的で 非構造化データの例をより多く使いますが テーマの中でニューラルネットワークの 適用方法を考えるなかで 構造化データ、非構造化データの両方での 使い方を理解してもらいたいです まとめるとニューラルネットワークによって 教師あり学習は大きく形を変え 膨大な経済的価値が生まれています しかしニューラルネットワークの裏にある 基本的な技術的考えは もう何十年も存在しているものです ではなぜつい最近になってやっと盛り上がり 上手く動作するようになったのでしょうか 次のビデオではなぜ近年になって初めて ニューラルネットワークが利用可能で 信じられないほど 強力なツールになったのかを紹介します