2018-07-01から1ヶ月間の記事一覧
matplotlibの基本的なグラフの作成およびグラフを横に並べる方法を紹介します.
過学習をできるだけ抑えて,テストデータの精度を上げたいと思います. 精度を上げるために,パラメータチューニングを行います.交差検証でチューニングを評価することにより過学習を抑えて精度を上げていきます.
CNNで文字識別を行います.In -> [[Conv2D->relu]*2 -> MaxPool2D -> Dropout]*2 -> Flatten -> Dense -> Dropout -> Out となるCNNを作成します.
可視化することで何か得られることがあるかもしれないので,データを可視化して把握することはとても重要です.今回はTitanicのデータを可視化してみたいと思います.
Kaggleというのはデータサイエンスにおいて非常に有名なコミュニティです.そこではコンペが開かれていて,ユーザー登録をすれば,誰でも無料で参加可能です.AtCoderとは,競技ブログラミング(競プロ)のコンテストです.
KaggleのTitanicを実際に解いていきます.1.不要データ削除,2.欠損値補完,3.文字を数値に変換,4.学習で進めていきます.訓練データの精度は98%まで上がりました.
Jupyter notebookは標準では入力補完はありませんが,設定すれば補完機能を使うことができます.nbxtensionsのインストール後,Hinterland にチェックを入れれば完了です.
PycharmとはJetBrains社が提供するIDE(統合開発環境)です.IDEとはIntegrated Development Environmentの略で,エディタと違ってコードが書けるだけでなく,でバックやコンパイルもIDE内でできてしまいます.さらに,,Pycharmの有料版は学生なら無料で使えます.
Pycharm日本語化 Pycharmは表記が全て英語になっていますが,日本語化することができます.以下の方法でJetBrains社のIDE全て日本語化することができます. ・以下のサイトから下の写真にあるようなPleiades プラグイン・ダウンロードの欄からダウンロードしま…
Jupyter notebookの便利な設定としてモジュールの更新,インラインでグラフの表示,shellコマンド実行があります.それぞれのコマンドを紹介します.