機械学習
TCAV (Testing with Concept Activation Vectors)について詳しく&わかりやすく解説していきます. 一言でまとめると, TCAVは, 画像分類に対して, あるConcept (人間が簡単に理解できるような概念)があるクラスを予測する際にどの程度重要であるかを判断する…
個人的にNetworkの全ノード名を知りたかったので, ネットワーク (.pb)を解凍して全ノード名を得るような関数を作成しました.
ImageNetで事前学習したモデルをTensorflowで使用するために, Kerasで事前学習したモデル (Pretrained model)をckptファイルで保存した後にpbファイルに変換してTensorflow上で解凍するための操作を行いました.
CyberAgent(サイバーエージェント)インターン体験記第二弾です! CA Tech JOBという長期インターンで2020/02/06~2020/02/28までAirTrackという部署で勤務を行いました.
2019年9月にCyberAgent (サイバーエージェント)の短期インターンであるCA Tech Challenge AbemaTV Hack -データコンペ編-に参加したのでその話をまとめさせて頂きます.
XAIに関する論文を読んだのでまとめてみたNeurIPS 2019に採択されたXAI (Explainable AI)に関する論文 (This Looks Like That: Deep Learning for Interpretable Image Recognition)です. アイディアは非常に面白いので是非目を通して頂けると嬉しいです.
An Introduction to Statistical Learning with Applications in R(ISLR)を読みました.
過学習をできるだけ抑えて,テストデータの精度を上げたいと思います. 精度を上げるために,パラメータチューニングを行います.交差検証でチューニングを評価することにより過学習を抑えて精度を上げていきます.
CNNで文字識別を行います.In -> [[Conv2D->relu]*2 -> MaxPool2D -> Dropout]*2 -> Flatten -> Dense -> Dropout -> Out となるCNNを作成します.
可視化することで何か得られることがあるかもしれないので,データを可視化して把握することはとても重要です.今回はTitanicのデータを可視化してみたいと思います.
Kaggleというのはデータサイエンスにおいて非常に有名なコミュニティです.そこではコンペが開かれていて,ユーザー登録をすれば,誰でも無料で参加可能です.AtCoderとは,競技ブログラミング(競プロ)のコンテストです.
KaggleのTitanicを実際に解いていきます.1.不要データ削除,2.欠損値補完,3.文字を数値に変換,4.学習で進めていきます.訓練データの精度は98%まで上がりました.
機械学習はコンピュータに学習させるためのデータを渡して学習させます.その学習をもとに未知なるデータを予測するというのが機械学習の目的です.機械学習は大きく2つに分かれます.教師あり学習と教師なし学習です.
データと言うのはどこから生まれるのでしょうか?ネット上ではユーザーが様々なサービスを利用することで,ネットユーザーの情報が蓄積されていきます.ここでは,ユーザーのデータを集める手段としてAPIとスクレイピングを紹介します.