こんにちは。わたやんです。
僕は将来データサイエンティストを目指して勉強しています。
今日は、データサイエンティストには必須のスキルである機械学習について語らせてください。
Contents
今さら聞けない機械学習とは
機械学習とは
機械学習はAI の一つの分野です。

機械学習(machine learning)は、何かしらの目的を達成するための知識や行動を、データを読み込ませることで機械に獲得させるための技術です。
機械学習は大きく、教師あり学習(supervised learning)、教師なし学習(unsupervised learning)、強化学習(reinforcement learning)に分けられます。
この分け方以外にも、教師あり学習と教師なし学習の2つに分けたり、これらの3つに、さらに半教師あり学習を加えて4つに分けることもあります。。
現在、爆発的なブームを起こしているディープラーニングも機械学習の一部です。
機械学習で人気なプログラミング言語「Python」
機械学習で一般的に使われる言語として、下記があります。
- Python
- R
- Octave
- C/C++
- Java
- etc…
機械学習のモデル構築を行う際でも、複数の言語から選択が可能なのはわかりましたが、その中でも特に人気の言語があります。それが「Python」です。
以前にアメリカの企業が約2000名の機械学習エンジニアに対して行なった、「機会学習で使う言語」に関するアンケートでは、1位が「Python」で2位が「R(アール)」という結果がありました。
AIブームの再来とともに、pythonの人気を上がり、現在最も人気のある言語です。
機械学習の重要性
機械学習はそもそもなぜ大きく注目されるのでしょうか。
それは、「人間では到底実現不可能な短時間で、大量のデータから自動的に正確な結果を得ることができる。」からです。
機械学習は、大量のデータからパターンを読み取り、問題を解決します。
大量のデータを人力で処理するとなると、非常にコストがかかり現実的ではありません。
以上の理由から、画像、音声、マーケティング、自然言語、医療など様々な分野において真価を発揮し、今日機械学習が大変注目を集めています。
さらに、時代とともに、コンピュータの処理速度が向上し豊富なデータの解析に耐えうるデバイスが登場したのもその要因の1つでしょう。
機械学習の種類
1.教師あり学習
説明変数(インプット)から目的変数(アウトプット)を予測するモデルを求める手法です。
訓練データには目的変数や説明変数があり、あらかじめ作ったモデルに訓練データの説明変数を入力し、そのモデルからの出力が訓練データの目的変数に近づくようにモデルのパラメータを調整することで学習していきます。
難しい言い方をしましたが、端的にいうと、正解のデータを与えて関係性を学習させるのが教師あり学習となります。
たとえば、メールのタイトルや内容(説明変数)からスパムか否か(目的変数)を識別したいとき、
株の売買状況(説明変数)から株価(目的変数)を予測したいときなどに使われます。
2.教師なし学習
教師なし学習は、教師あり学習の反対で正解のデータをコンピュータには教えません。
入力データそのものに着目し、データに潜むパターンや示唆を見いだす手法です。
多数のデータをいくつかの類似グループに分けるクラスタリングや、
データ次元(変数の数)を、元のデータの情報を失わないようにより少数の次元に縮約する主成分分析などの手法があります。(3次元→2次元みたいな)
3.強化学習
人は失敗や成功を重ねることで成長していきます。
「強化学習」では同じように失敗や成功を繰り返し、それに対して報酬を与えることで学習効率を上げていくことが可能です。
この学習方法は最短経路の探索やゲームの攻略に力を発揮します。

機械学習が使われている事例とは?
メールのスパムフィルター
迷惑メールによく出てくる単語とその出現確立をもとに、スパムと非スパムの分類を行っています。
これは機械学習の中でも教師あり学習なので、正解のわかっているデータを大量に用意する必要があります。
自動運転
自動運転には様々な機械学習の手法が使われていますが、根幹となる一つの手法として強化学習が使われています。
自動運転車に取り付けられた多数のセンサーからデータを取得し、様々なシチュエーションを学習することによって自律的に上手な運転を学んでいきます。
顔認識
コンピューターに人間の顔画像を大量に渡して、顔の特徴を覚えさせます。
人の顔の場合、口が一つで目が二つ、といった具合に、覚えた特徴をもとに顔認識を行っています。
まとめ
機械学習はハードルが高いと思われがちですが、実はある程度の数学知識とプログラミングスキルがあれば誰でも始めることができます。
機械学習エンジニアの将来性はこれからも伸びていくとされています。
何か新しいことを勉強してみたいと思っている方は、これを機に機械学習の勉強を始めてみてはいかがでしょうか!
人工知能と機械学習の人気オンライン講座

コメント
[…] 今さら聞けない機械学習 […]
[…] 「教師あり学習?なんやそれ」と思った人はこちらをどうぞ → 今さら聞けない機械学習 […]
[…] 今さら聞けない機械学習 […]
[…] そもそも機械学習を知らない人は、「カテゴリカル変数ってなに?」て感じだと思います。→今さら聞けない機械学習 […]