hirolog

20代医大生のブログ。日々の情報収集のアウトプット。

プログラミング初心者が機械学習を1ヶ月勉強し続ける #day8

今日の目標

Machine Learning - Stanford University | Coursera

を始めてから7日目となります。

ついに1週間経ちました!このコースも残りあと少しです。

今日はWEEK7のプログラミング課題とWEEK8まで終わらせたいなあ。

8日目でやった事

Machine Learning WEEK7 プログラミング課題終了

全部でかかった時間:7時間(昨日の4時間含む)

難易度:★★☆☆☆

感想

今回のプログラミング課題は意外とすんなりクリアできました。

最初の頃の課題はかなり悪戦苦闘していたので、それと比べるとスムーズに課題を進めることができるようになってきました。

前半はSVM、後半はスパムメール分類器のアルゴリズムです。

実際にスパムメール分類器を実装できるところまで課題が組まれているのでやっていて非常に面白かったです。本当に課題がよくできていますね、1週分につき5000円くらいとってもいいレベルです。これが無料でできるって本当にいい時代。。

Machine Learning WEEK8 終了

全部でかかった時間:8時間

難易度:★★☆☆☆

内容

クラスタリング

・K平均法

・コスト関数

・random initialization

・クラス数Kの選び方

次元削減

・データ圧縮

・ビジュアル化

・主成分分析(PCA)

・reconstruction

・PCA適応のアドバイス

感想

WEEK8は教師なし学習について扱いました。

K平均法はアルゴリズムが非常にシンプルな割にやっていることはとても面白いので、かなり汎用性がありそうだと感じました。課題では画像の容量を圧縮するために、圧縮後の各ピクセルの色を16色に限定して、各ピクセルがどの色に該当するかをクラスタリングしました。なんかこういうエフェクト見たことあるなあっていう画像が出来上がります。

PCAについてはロジスティック回帰やニューラルネットワークなどの教師あり学習でも応用できるし、使う頻度もかなり高そうです。やっていることも感覚的に理解しやすいです。なぜ分散共分散行列を計算するとPCAがうまくいくのかは非常に気になりましたが、、

課題では人の顔画像データの特微量をPCAによって下げるということをやりました。データサイズは1/10になるにも関わらず、reconstructionしたらちゃんと元の画像に近いものに戻っていたのが意外でした。

明日に向けて

残るはWEEK9,10,11ですが、10,11はプログラミング課題がなくそれぞれ想定所要時間が1時間半ほどなので、明日この3つを気合いで終わらせたいと思います。

ちなみに修了証には課金する気満々でいます。これだけ頑張ったらその証が欲しくなるよね、誰しも。。