Machine Learning with R
本サイトは書籍 『Rによる機械学習』 (以降、テキストと表記)を用いた 2019年度データ分析勉強会 の非公式まとめサイトです。
想定読者
本サイトは以下のような読者を想定しています。
- R言語に関する基本的な知識を有している
- 機械学習を学ぼうとしている
- 勉強会参加者
R言語の初学者の方は最初に以下の書籍でR言語に関する基本的な知識を習得することをおすゝめします。
目次
章 | タイトル | 必要なパッケージ | 備考 |
---|---|---|---|
第1章 | 機械学習入門 | RWeka | 第1回実施予定 |
第2章 | データの管理と把握 | gmodels | 第1回実施予定 |
第3章 | 遅延学習 - 最近傍法を使った分類 | class, gmodels | 第2回実施予定 |
第4章 | 確率的学習 - 単純ベイズを使った分類 | tm, SnowballC, wordcloud, e1071, gmodels | |
第5章 | 分割統治 - 決定木と分類ルールを使った分類 | C50, gmodels, RWeka | |
第6章 | 数値データの予測 - 回帰法 | psych, rpart, rpart.plot, RWeka | |
第7章 | ブラックボックス的な手法 - NN1とSVM2 | neuralnet, kernlab | |
第8章 | パターンの検出 - 相関ルールを使った買い物かご分析 | arules | |
第9章 | データのグループの検出 - k平均によるクラスタリング | ||
第10章 | モデルの性能の評価 | gmodels, caret, vcd, irr, ROCR, C50 | |
第11章 | モデルの性能の改善 | caret, ipred, C50, adabag, vcd, randomForest | |
第12章 | 機械学習の専門的なテーマ | rio, RODBC, RCurl, httr, rvest, XML, xml2, rjson, igraph, dplyr, data.table, ff, ffbase, snow, foreach, doParallel, caret |
1 ニューラルネットワーク(Neural Network)の略
2 サポートベクトルマシン(Support Vector Machine)の略
機械学習関連サイト
Open Data for Machine Learning
- kaggle Datasets
- UC Irvine Machine Learning Repository
- 青空文庫 形態素解析データ集
- 国立情報学研究所 情報学研究データリポジトリ
- 利用には申請(オンラインまたは郵送)が必要なのでオープンではないですが…
MOOCs (Massive Open Online Courses)
注意事項
- 本サイト内の資料の著作権は原則として著作者に帰属しますが、資料中で引用しているロゴ・画像・文書などの著作権は原著作者が所有しています
- 本サイト内の資料を使用することによって生じる、いかなる直接的・間接的損害について著作者はいかなる責任・サポート義務は負いません