メインコンテンツへ

データサイエンス分析プロジェクトの進め方


ptp024を受講登録 (有料)

※受講登録するとお客様の利用者情報は講座提供者(講師)に共有されます。詳しくは利用規約プライバシーポリシーをご覧ください。

  • 講座番号:ptp024
  • 想定される勉強時間/週:8時間程度

本講座は有料講座です。お申し込み前に、本ページの内容を必ずお読みください。

この講座は受講申込前にgaccoの会員登録(無料)が必要となります。会員登録がお済みでない方は、会員登録後ログインし、改めて受講申込画面にお進みください。
なお、会員登録を進めていただく途中でgaccoより認証メールが届きます。迷惑メール対策をされている方は「@gacco.org」を受信できるように設定・確認をお願いいたします。(すでにgacco会員の方は、下記注意事項をお読みいただき、ページ上部『ptp024を受講登録(有料)』ボタンを押して受講申込(購入)ページへお進みください。)


instruction

【講座申し込み方法】

・gacco会員登録後、注意事項(この枠内)を最後までお読みいただき、すべての項目をご理解・ご了承いただいた受講者さまはページ上部にある『ptp024を受講登録(有料)』ボタンを押していただきますと、注意事項に同意したとみなして受講申込(購入)ページへ移動いたします。

【受講料について】

・受講料:22,000 円(税込)

・お支払いは、クレジットカードまたはd払いにて承ります。クレジットカードはVISA/MASTER/DINERS/AMEX/JCBがご利用いただけます。なお、設定できるお支払い回数は一括払いのみとなっております。

【受講受付期間】

・2022年8月23日(火)15:00 ~
※事前通知なく、受付を終了させていただく場合がございます。

【受講(視聴)期間】

・本講座はお申し込み日より受講開始となる『開始日可変型講座』です。
『開始日可変型講座』とは、受講者個々の受講開始日に応じて進行する講座です。
■開講日:2022年8月23日(火)15:00
■動画視聴・課題提出期間:受講登録してから90日間(90日×24時間=2,160時間)
ご自身のスケジュールは、本ページ内掲載の講座スケジュール(PDF形式:258 KB)を参考にご確認ください。

※システムの更新・メンテナンス等により一時的にサービスを休止することがございます。予めご了承ください。詳細は、システムメンテナンスに関するお知らせにてご確認ください。

【お支払い後のキャンセル・視聴期間の変更について】

・お申し込み後、受講者さまのご都合によるキャンセル、日付の延長などは承ることができませんので、予めご了承の上お申し込みください。お使いのモニター機種、設定、ブラウザ、OSのバージョンによって講座映像の色合いなどの違いが生じる場合もございますが、視聴には問題がございません。

 よくある質問:システム動作環境について

必ず最後まで内容をご確認ください。上記注意事項に同意いただける方は、「ptp024を受講登録(有料)」のボタンを押してください。注意事項に同意したとみなして受講申込(購入)ページへ移動いたします。




この講座はお申込み日より受講開始となる『開始日可変型講座』です。
『開始日可変型講座』とは、受講者個々の受講開始日に応じて進行する講座です。

ご自身のスケジュールは、以下の講座スケジュール(PDF)を参考にご確認ください。

受講前に必ずこちらをクリックしてお読みください

講座内容

皆さんの中で、「データサイエンス分析プロジェクトは決まったステップがあって、その通りやれば成果が出る」と思っている方はいませんか?実際には、データサイエンスのプロジェクトは「やってみないとわからない」という性質があり、それが一般的なプロジェクトとは異なるポイントになっています。

本講座では、データサイエンスのプロジェクトを進めるうえで、どのような作業が発生するのかを理解していただき、マネジメントや業務を依頼するうえで重要なポイントを理解することがゴールです。そのためにビジネス課題から議論をスタートし、どのように考えて分析を行うかをケースを用いながら説明していきます。また、PythonとRを使ってどのように分析作業を行うのかも具体的に説明していきます。

特に以下を達成します。
・データサイエンスプロジェクトのステップを理解する
・機械学習を使ったデータ分析の作業ステップや押さえるべきポイントを理解する
・Pythonで機械学習を用いたモデル構築方法を理解し、実行できる
・ビジネスにおける統計学の使いどころを具体的に理解する
・Rで仮説検定や回帰分析といった統計解析手法を実行することができる


機械学習-はじめに

  • イントロ〜講義の進め方について
  • 機械学習の分類

予測モデルの構築プロセスの全体像

  • 予測モデルの構築プロセスの全体像

ビジネス課題から分析課題への翻訳

  • ビジネス課題から分析課題への翻訳

データの準備

  • データの準備

データ前処理

  • データ前処理の目的

  • Pythonを使ったデータ読み込み
  • データ理解のポイント (1)要約統計量の確認
  • Pythonを使ったデータ理解 - (1)要約統計量の確認
  • データ理解のポイント (2)分布の確認
  • Pythonを使ったデータ理解 - (2)分布の理解
  • データ理解のポイント (3)欠損値の確認
  • Pythonを使ったデータ理解 - (3)欠損値の確認

  • データ加工のポイント
  • Pythonを使ったデータ加工 - (1)文字列からデータ抽出
  • Pythonを使ったデータ加工 - (2)カテゴリ変数の処理
  • Pythonを使ったデータ加工 - (3)新たな特徴量を作成

モデルの構築

  • モデルの構築
  • Pythonによるモデリング

モデルの性能評価

  • モデルの性能評価の指標
  • Pythonによるモデルの性能評価

機械学習-まとめ

  • ここまでのまとめ

統計学-はじめに

  • ビジネスにおける統計学の使いどころと学び方
  • 統計学とは何か?

分析例

  • 分析例(1) - データ可視化で課題を発見する
  • 推測統計学の手法を使った分析の例

統計モデリング

  • 統計モデリングの基本的な考え方

確率分布

  • Rでの確率分布と乱数の使い方
  • 確率分布の数式
  • ポアソン分布
  • 正規分布
  • 正規分布と二項分布、ポアソン分布の関係
  • 指数分布
  • 一様分布

仮説検定

  • おさらい!仮説検定の考え方
  • Rで簡単!t検定のやり方
  • 2群のt検定
  • Rで簡単!2群のt検定のやり方
  • 仮説検定でよくある疑問
  • サンプルサイズの決め方

回帰分析

  • 線形回帰モデルのコンセプト
  • まずは練習!Rで単回帰分析をやってみよう
  • 説明力のある変数はどれか?
  • 当てはまりの良さを表す「決定係数」
  • 実務でもよく使う重回帰分析
  • モデル選択 - どの説明変数を残すか?
  • カテゴリデータをモデルに組み込むには?
  • なんか変だなと思ったら - 多重共線性を疑え!
  • 線形回帰分析を使った予測
  • グループに分けて回帰分析を行う
  • Rでの重回帰分析の実行方法

講師・スタッフ紹介

堅田 洋資

堅田 洋資(かただ ようすけ)

株式会社データミックス 代表取締役社長/データサイエンティスト


データサイエンティスト育成スクールを運営するデータミックスの代表。これまで数百人以上の社会人に対して、データサイエンスの教育を行ってきた。その他、大企業からベンチャーまでデータ分析プロジェクトの支援、データ分析チームの立ち上げの支援を行う。データミックスの創業前は、ニュースアプリベンチャーでデータサイエンティスト、監査法人トーマツにてデータ分析コンサルタント、生体センサスタートアップでサービス・アルゴリズム開発の取締役、KPMG FASにて事業再生コンサルタント、外資系メーカーでの経理・マーケティングなど幅広い経験を持つ。


■学歴
University of San Francisco, M.S. in Analytics修了
一橋大学商学部卒業(統計学・データサイエンス専攻)

■著作
「フリーライブラリで学ぶ機械学習入門」(秀和システム)
「直感でわかる! Excelで機械学習」(インプレス)

受講料

22,000円(税込)

前提条件

・Pythonの基礎的な文法(リスト、forループ、if文、関数など)を理解していること
・Rの使い方(作業ディレクトリの設定、ベクトルやデータフレームの操作方法など)を理解していること
・統計学の基礎(正規分布のパラメーター、仮説検定の論理展開)を理解していること

課題内容

各章選択式の確認テスト
最終章に確認テスト

修了条件

得点率60%以上

受講可能期間

本講座購入後から90日間
※受講可能期間を過ぎた後の課題の提出、動画の閲覧はできませんのでご注意ください。

※受講登録するとお客様の利用者情報は講座提供者(講師)に共有されます。詳しくは利用規約プライバシーポリシーをご覧ください。

  • 講座番号:ptp024
  • 想定される勉強時間/週:8時間程度
受講登録