ビジネスのための実践データ分析講座(初心者向け)

講座の概要

■ビジネスに活用するための必要知識・手法について取り上げ、分析の考え方と、用いるべき手法について学び、データ分析の本質の理解、実践力の習得を目指します。
■データ分析の初心者の方を対象に、分析のためのEXCELの基本的操作方法から実践的な活用方法まで学習します。
■ハンズオンによる豊富な事例演習体験により、実務に役立つ実践的なデータ分析処理能力を養成します。

注)EXCELの分析操作を理解されている方には、2日目及び3日目のみの受講も可能です。
注)2・3日目の内容は、別講座「実践統計学」と同等の内容ですが演習をより多く扱います。

受講対象

・ビジネス分野におけるデータ分析方法の基本知識、実践的分析手法の習得を目指す初心者の方
・EXCELを用いてビジネスデータを実践的に分析・活用したい方
(特に高度な数学の知識は必要ありません。)

受講期間・費用

3日間・130,000円(税込) 9:30~16:30(休憩12:30~13:30)

講座の特徴と進め方

・講師と受講者の双方向性を重視した講義・演習を行います。
講師と受講者のコミュニケーションを重視します。(リアルタイムチャット機能を活用したライブ感のあるオンライン講座とします。)

・基礎から学習します。
EXCELの初心者、データ分析の初心者の方でも問題ありません。

・ビジネス分野に役立つ実践的な分析手法を習得します。
ビジネス分野におけるデータ分析に有効な分析手法、複数の分析手法を組み合わせた分析方法等、実践的事例を数多く扱います。

・ビッグデータに合わせた分析手法についても習得します。
ビッグデータの場合は同じ分析結果であっても解釈が異なります。演習を通じて実践的に学びます。

・受講後のご質問等に対応致します。
講義は同時収録され、受講後1年間アーカイブによる再受講が可能です。また、ご質問にも対応します。

講座の概要

【1日目】
1.EXCELの基本的な使用法と分析の基礎
1.1 Excel操作の基礎
 行・列の選択方法、行列の並べ替え、セルの移動、絶対参照等分析に必要な操作方法について学びます。
1.2 分析に必要なEXCELの関数
 算術平均、幾何平均、分散、標準偏差、中央値、最頻値、四分位数、積率相関係数・・
1.3 データのカウントとクロス集計
 分析に必須なデータの整理・集計方法について学びます。
 条件指定カウント、並び替え、フィルタ、ピポットテーブル
1.4 データの可視化
 分析するデータに合わせた可視化の方法、グラフの解釈方法について学習します。
 箱ひげ図、ヒストグラム、散布図、層別散布図、棒グラフ、積み上げ棒グラフ、円グラフ、折れ線グラフ(対数目盛)、
 レーダーチャート、バブルチャート
 グラフの調整方法
 タイトルの追加・変更、軸の書式設定、要素(データ系列)の書式設定
2 データの特徴について理解する。
 データの特徴(偏り、外れ値の有無)の把握方法、バラツキの重要性と判断への活用方法、標準化を用いたデータの比較方法について学びます。
2.1 データ群の代表値の把握
 ・いろいろな平均(算術平均、幾何平均)
 ・バラツキの重要性(分散、標準偏差、変動係数)
 ・外れ値があるときの代表値(中央値、四分位範囲)
2.2 グラフの活用方法
 ・箱ひげ図を用いて外れ値の有無についてチェックする。
 ・ヒストグラムでデータ全体の偏りを把握する。

【2日目】
1.データの特徴について把握する。
 データの特徴(偏り、外れ値の有無)の把握方法、バラツキの重要性、Z値と正規分布の関係等について学びます。
1.1グラフの活用方法
  ・箱ひげ図を用いて外れ値の有無についてチェックする。
  ・ヒストグラムでデータ全体の偏りを把握する。
1.2平均、バラツキについて(基本統計量)
  ・バラツキ(分散、標準偏差)の計算方法
  ・データの正しい評価方法
  ・正規分布の正しい理解と活用方法

2.平均値の差について検討する。
 得られたデータに合う分析手法の選択方法、分析結果の解釈方法、サンプルサイズの設定方法等について学びます。
2.1 平均値の差の検討(t検定)
  ・t分布と正規分布の違いについて
  ・違いの大きさを有意確率、区間推定で判断する。
  ・サンプルサイズの異なる分析結果の比較には、有意確率ではなく効果量を用いる。
  ・サンプルサイズが小さい場合は、検出力に注意する。
  ・検出力の小さい分析の結果は信頼度が低い。
  ・ビッグデータにおいては、有意確率はまったく参考にならない。
2.2 対応のある場合
  ・対応の有無は、分析者が判断する。
  ・対応データは、差に着目した分析である。
  ・対応の有無を間違えると正しい分析結果は得られない。
 - 食品の有効成分含有量について検討する
 - 新製品の好感度について男女別に比較する
 - 地域による売上高の違いについて検討する
 - DMの送付前後による売上高の違いについて検討する
 - 地域・年代による企業好感度に違いは見られるか
 - 新製品のテレビCM前後による評価の違いについて調べる

3. クロス集計、比率の平均値の差について(カイ二乗検定)
 アンケート等のクロス集計の結果を分析する方法について学びます。
 - 主力製品の知名度を、競合他社と比較する。
 - メルマガの配信前後による商品好感度の違いについて判断する
 - CM前後の知名度、好感度の差について比較する

4.二群の関係について把握する。(相関分析)
 2つの量の関係について、関係をグラフで把握する方法、及び数値で把握する方法について学びます。
4.1 散布図の活用方法
 散布図の正しい書き方、データの属性による散布図の正しい解釈方法について
 - 地域別広告費と売上高の関係について検討する。
 - 顧客属性別広告費と売上高の関係について検討する。
4.2 積率相関係数、順位相関係数
 相関係数のしくみと解釈の方法、相関係数の選択方法、外れ値との相関係数の関係について
 - 天候と来客数と売上高の関係について検討する。
 - 年齢と売上高の関係について検討する。
4.3 偏相関係数(交絡要因)
 交絡要因がある場合の相関係数と解釈の方法について
 - 地域別広告費と売上高の関係について検討する
 - 地域別の広告費、人口と売上高の関係について検討する

【3日目】
1.二群以上の因果関係について検討する。(回帰分析)
 注目する量(売上高等)と、それに影響を与えると思われる量的データ、説明変数が質的データ(男女…等)の場合の分析方法、及び外れ値がある場合の分析方法について学習します。
1.1 回帰モデルのしくみ(従属変数、説明変数)
1.2 モデルのチェック方法(決定係数、t検定)
 -専有面積と売上高の関係に検討する
 -実測気温と駅の乗降客数が売上高に与える影響ついて検討する
1.3 ダミー回帰
 - 売上高に対する広告費の効果について地域別に検討する
 - 売上高に対する広告費の効果について男女別に比較検討する
 - 売上高と、広告費、人口、DM発送数の関係について検討する
 - 駅前コンビニの売上に与える各要因別に影響度合いの比較、及び売上高を予測する
 - 顧客別の売上実績、セールスマン数、広告宣伝費、商圏人口データから、売上高を予測するモデルを構築する

2.総合演習
 具体的な複数の事例について、総合的視点から実践的に試行錯誤しながら分析します。
 ・箱ひげ図、ヒストグラムによる検討
 データの外れ値、カテゴリー化、分布・正規性について検討します。
 ・散布図行列による相互関係の検討
 外れ値の把握、カテゴリー化について検討します。
 ・相関行列による相互関係の検討
 従属変数・説明変数間の相関関係、説明変数間の独立性について把握・検討します。
 ・交互作用について
 データ群の属性によるデータの分割により交互作用の有無について検討します。
 ・回帰分析結果の解釈から回帰モデルの再構築
 変数の再選択、カテゴリー化等、試行錯誤により最適モデルを求めます。

 (セミナーの内容は変更される場合があります)
 *セミナー終了後、希望される方には様々なご相談も可能です。