ビッグデータのためのデータ解析法(入門編)

~ビッグデータの解析によく用いられる各手法(ハンズオンセミナー)〜

セミナーの概要

 本セミナーでは、「ビッグデータ」の解析によく用いられる手法を具体的な事例演習により学びます。
 各解析手法の基本的なしくみを理解し実践的な活用能力の習得を目指します。
 実践的な理解のために、EXCEL、Rを用いて、受講者各自1台ずつPCによる演習を行います。
 (PCはご用意致しますが、持ち込みも可能です。)

担当講師

伊藤嘉朗

受講対象

・ビッグデータの活用方法について実践的に学びたい方
・ビッグデータの解析手法のしくみについて習得したい方
 (特に数学・プログラミングの知識は必要ありません)

学習内容

1.ビッグデータとは
  ビッグデータの特徴、ビッグデータを取り扱う上で注意すべきことについて解説します。

2.ビッグデータにおける統計解析
  サンプルサイズの違いによる解析結果の解釈方法、外れ値の定義、処理方法について学びます。
  ・検定における有意確率の有効性
  ・効果量の活用方法
  ・外れ値の定義
  ・箱ひげ図、ヒストグラム

3.相関分析
  相関関係の基本的なしくみについて学びます。
  ・散布図
  ・相関係数のしくみ
  ・外れ値による影響
  ・交絡要因とは何か
  ・偏相関係数の求め方

4.重回帰分析
  基本的な回帰分析、外れ値を勘案した回帰分析の方法等について理解します。
  ・回帰分析のしくみ
  ・回帰モデルの判断方法(t検定、決定係数)
  ・ロバスト回帰
  ・リッジ回帰、オーバーフィッティング(過学習)問題

5.ロジスティック回帰分析
  従属変数が2値変数である回帰分析について学びます。
  ・ロシスティック回帰分析のしくみ
  ・オッズ比のしくみと活用法
  ・予測値(確率)の算出と分類方法

6.判別分析、SVM(サポートベクターマシン)
  分類問題によく使用される解析手法について学びます。
  ・判別分析のしくみ
  ・分類方法
  ・SVMのしくみ(サポートベクター、マージン)
  ・判別分析とSVMによる分類の違い

7.クラスター分析
  データのクラスタリングの方法について解説します。
  ・階層クラスタリングによる分類
  ・k-meansクラスタリングによるデータの層別
  ・クラスタリング方法の違いによる特徴とよく用いられる方法

8.主成分分析
  変数の集約(縮約)によく用いられる手法について説明します。
  ・主成分分析のしくみ
  ・主成分分析による次元の縮約方法

(セミナーの内容は、一部変更される場合がございます)

 

・セミナー終了後、希望される方には業務への活用方法等についてご相談に応じます。

 
セミナーのお申し込みはこちらから