Skip to main content

データサイエンスの必須スキル!データ研磨入門~大学生のためのデータサイエンスシリーズ~


[Free of charge] Enroll

※受講登録するとお客様の利用者情報は講座提供者(講師)に共有されます。詳しくは利用規約プライバシーポリシーをご覧ください。

  • 講座番号:pt168
  • 受講開始日:2024年4月1日 15時
  • 想定される勉強時間/週:3,4時間程度

講座内容

 これまで、滋賀大学が提供した「大学生のためのデータサイエンス(I)」では、データサイエンス全体の概要を説明しました。また(II)では、ビジネス価値創造に役立つ機械学習手法を紹介しました。さらに(III)では、データサイエンスを活用して問題を解決するための具体的な知識やスキルについて、事例を通じて紹介しました。

 今回、データを分析が可能な形式にするための前処理である「データ研磨」に着目し、分析対象となるデータそのものに焦点を当てました。より実践的なデータ利活用の実現を目指して、「データサイエンスの必須スキル!データ研磨入門」を開講します。まずは、データサイエンティストに必要なスキル、データサイエンス業務の流れの中でそれぞれのスキルがどのように生かされるのかについて説明します。次にデータを理解し活用するためのデータリテラシーについて学び、データを解析可能な状態に研磨し、構造化する処理や、操作・変換・集計などの処理スキルを習得します。そして、具体的なデータ例として日本プロ野球選手データやゲームハード販売台数データなどを用いて、プログラム演習を行います。最後に、住民基本台帳に基づく人口データを題材にして、生産年齢人口の可視化までのデータ研磨の一連の作業を実践的演習で体験します。


第1週:データ前処理の必要性

  • プロローグ
  • 対談:
  • データサイエンティストに求められるもの
    データサイエンス業務の流れ


第2週:データサイエンスに必要なデータリテラシー

  • プログラミングのススメ
  • データ仕様の確認
  • データの中身の確認
  • データ処理基盤の概要
  • データ研磨をする際の心掛け

第3週:データ研磨スキル習得

  • データサイエンスと相性のいいデータ研磨環境
  • 基礎スキルの理解1 ~基本設定、ファイル処理、カラム・値操作~
  • 基礎スキルの理解2 ~レコード操作、結合処理~
  • 基礎スキルの理解3 ~構造変換・集計処理、可視化~

第4週:データ研磨スキル習得演習

  • 日本プロ野球選手データのデータ研磨(R編)
  • 日本プロ野球選手データのデータ研磨(Python編)
  • ゲームハード販売台数のデータ研磨(Python編)
  • ゲームハード販売台数のデータ研磨(R編)

第5週:データ研磨実践演習

  • データ研磨を通じて実現したいこと
  • データ研磨手順の構築
  • データ研磨工程(1)
  • データ研磨工程(2)
  • データ研磨工程(3)
  • データの可視化
  • データ研磨後にやるべきこと
  • エピローグ:社会で活躍できるデータサイエンティストへ


講師・スタッフ紹介

(講演順)
※講師の所属については2024年1月5日時のものです。


深谷 良治

滋賀大学データサイエンス・AIイノベーション研究推進センター 教授

保科 架風

青山学院大学経営学部 准教授
滋賀大学データサイエンス・AIイノベーション研究推進センター 特任准教授

岡部 壮一郎

(株)帝国データバンク 企総部企画課 主任
帝国データバンク・滋賀大学Data Engineering and Machine Learning Center 研究員

海老原 吉晶

(株)NTTデータバリュー・エンジニア コーポレート管理本部 管理部長
滋賀大学データサイエンス・AIイノベーション研究推進センター 客員研究員

大里 隆也

(株)帝国データバンク プロダクトデザイン部プロダクトデザイン課 課長補佐
滋賀大学データサイエンス・AIイノベーション研究推進センター 特任講師

江崎 剛史

滋賀大学データサイエンス学部 准教授

菊川 康彬

(株)帝国データバンク 企総部企画課 課長補佐

前提条件

特になし

課題内容

毎週確認テスト

修了条件

得点率60%以上

学習期間

5週間

補助教材

『データサイエンスの必須スキル!データ研磨入門 ~大学生のためのデータサイエンスシリーズ~ オフィシャル スタディノート』

●下記サイトよりお申し込みいただけます

日本統計協会公式販売サイト
(ここから先は日本統計協会公式販売サイトのホームページに遷移します)
Amazon
(ここから先はAmazonのホームページに遷移します)



※受講登録するとお客様の利用者情報は講座提供者(講師)に共有されます。詳しくは利用規約プライバシーポリシーをご覧ください。

  • 講座番号:pt168
  • 受講開始日:2024年4月1日 15時
  • 想定される勉強時間/週:3,4時間程度
Enroll