“社会人のためのデータサイエンス・ オンライン講 …...competition, and...

23
“社会人のためのデータサイエンス・ オンライン講座"の実績 総務省統計局 吉田 明子 佐伯 真奈美 2016統計関連学会連合大会 平成28年9月5日

Transcript of “社会人のためのデータサイエンス・ オンライン講 …...competition, and...

Page 1: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

“社会人のためのデータサイエンス・オンライン講座"の実績

総務省統計局 吉田 明子 佐伯 真奈美

2016年 統計関連学会連合大会

平成28年9月5日

Page 2: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

0 背景 計測機器やインターネットの発達により、扱うデータ量が爆発的に増加

オープンデータの進展により、公開情報が増加 ビジネスの現場等における客観的なデータに基づく判断の重要性の高まり

我が国の国際競争力を維持し、経済成長を加速するためには、データに基づく数量的な思考により課題を解決する能力、いわゆる“データサイエンス”を身に着けた人材が不可欠

Page 3: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

1 人材を取り巻く状況 日本のデータサイエンス人材供給は不十分

McKinsey Global Institute, “Big data : The next frontier for innovation, competition, and productivity”

米国は、24730人、 中国は、17410人 、 英国は、8340人 諸外国に比し低い水準

※統計学や機械学習に関する高等訓練の経験を有し、データ分析に係る能力を有する大学卒業生

データサイエンス人材(※) 2008(平成20年) ⇒日本は年間3400人

Page 4: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

1 人材を取り巻く状況

2004年から2008年までの5年間で、 日本の新たなデータサイエンス人材供給は減少

McKinsey Global Institute, “Big data : The next frontier for innovation, competition, and productivity”

日本のデータサイエンス人材供給は減少

Page 5: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

2 “データサイエンス”力の 高い人材育成の取組 統計リテラシーの普及・啓発に取り組んできた総務省統計局及び統計研修所が、日本統計学会等と協力し、本喫緊の課題に対応

「世界最先端IT国家創造宣言」(平成28年5月20日閣議決定) 我が国が第4次産業革命を勝ち抜くために、初等中等教育において様々な課題解決に必要な論理的思考力や創造性、情報活用能力などの汎用的な力を育成しつつ、高等教育から研究者レベルにおいて、特に喫緊の課題であるIoT、ビッグデータ、AI、セキュリティ及びその基盤となるデータサイエンティスト等の人材育成・確保に資する施策を「第4次産業革命に向けた人材育成総合イニシアチブ」として、包括的に実施。

⇒●統計力向上サイト「社会人のためのデータサイエン ス・スクール」開設(平成26年6月)

●データサイエンス・オンライン講座の開設(26年12月) ・社会人のためのデータサイエンス入門(27年3月開講) ・社会人のためのデータサイエンス演習(28年4月開講)

Page 6: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

~統計検定の問題に挑戦~「あなたの統計力」

~意外な有名人も統計学に関係?~「ビジネスに役立つ統計講座」

~グラフの活用方法をわかりやすく説明~「プレゼングラフ作成のポイント」

~データ活用の体験談を紹介~「出来る人のビジネス活用術」

取組① 統計力向上サイト「データサイエンス・スクール」を開設(平成26年6月1日)

主に社会人、ビジネスパーソンを対象とし、パソコンやスマートフォンなどでデータの活用方法や統計に関する知識を、“いつでも誰でも気軽に学べる”統計力向上のためのサイト http://www.stat.go.jp/dss/index.htm

6

2-1 統計力向上サイト データサイエンス・スクール開設

28年7月 リニューアル!

Page 7: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

取組② データサイエンス・オンライン講座の開設(平成26年12月) 主に社会人、ビジネスパーソンを対象とし、自らの学びをサポートするウェブ上で誰でも無料で参加可能なオープンな講義 「MOOC(Massive Open Online Courses )」の手法を活用

(オンライン講座イメージ)

統計局

受講者

・ビデオ講義 ・テスト ・最終試験 ・修了証

・受講 ・回答 ・提出 ・受領

・ディスカッション 7

2-2 データサイエンス・ オンライン講座の開設

第一弾として、「社会人のためのデータサイエンス入門」開講

Page 8: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

政府初のMOOC講座 1回約10分のビデオ講義

×1週4~7回×4週 初回開講(平成27年3~5月) 再開講(27年11月~28年1月) 特別開講(28年2月~6月) ※特別開講=講義内容の閲覧は可能であるが、修了証が発行されない講座

3回の開講を合わせて社会人を中心に 3万4千人が登録

講座の概要

8

http://gacco.org/stat-japan

【内容】 第1週:データ活用への導入、分析事例から統計的な考え方、データの見方 第2週:データ分析に必要な統計学の理論的な基礎 第3週:データの見方について基本的な方法 第4週:誰もが入手可能な公的統計データとコースのまとめ

3 「社会人のためのデータ サイエンス入門」開講実績

Page 9: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

受講状況

9

3 「社会人のためのデータ サイエンス入門」開講実績

受講登録者数の推移

特別開講は開講のお知らせを公開した日から閉講日までの状況

0

2000

4000

6000

8000

10000

12000

14000

16000

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150

(人)

(日)

受講登録数

募集開始からの日数

記念講演会、日経BP対談

10,988人

開講11,722人

登録締切15,435人

開講

6,044人

登録締切

8,425人

初回開講

再開講

特別開講

閉講

10,375人

項 目 初回開講 再開講

受講登録者数 15,435 人 8,425 人

アクティブユーザー 4,943 人 2,124 人

修了者数 2,544 人 1,190 人

修了率 16.5 % 14.1 %

アクティブユーザーに対する修了率

51.5 % 56.0 %

受講登録者数及び修了者数

アクティブユーザー:課題に1問以上正解した受講者

初回開講では、開講日までに受講登録者数が1万1千人を超過。

受講登録者に対する修了者の割合(修了率)は初回開講の方が高いが、アクティブユーザーの修了率は再開講の方がやや高い。

Page 10: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

性別、年代、就業状態等の構成は、初回開講、再開講とも概ね同様となっている。

受講者の属性~開始アンケートより~

10

3 「社会人のためのデータ サイエンス入門」開講実績

男女の別

初回開講 n=6,101 再開講 n=1,819

初回開講 再開講

0.5%

0.7%

11.8%

13.0%

27.5%

28.9%

30.9%

28.8%

19.6%

17.1%

7.8%

9.0%

1.9%

2.1%

0.1%

0.3%

0% 20% 40% 60% 80% 100%

再開講

初回開講

10歳代 20歳代 30歳代 40歳代 50歳代 60歳代 70歳代以上 不詳

年代別

就業状態等の別

81.1%

79.5%

4.7%

5.3%

1.2%

1.8%

6.7%

7.5%

6.4%

5.9%

0% 20% 40% 60% 80% 100%

再開講

初回開講

フルタイムで働いている パートタイム、アルバイト 専業主婦(夫) 無職 学生

Page 11: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

全体でみると、初回開講では、やや文系が多かったが、再開講では理系がやや多い。

男女別にみると、初回開講では、男性は文系が、女性は理系が多かったが、再開講では男性は理系、女性は文系が多い。

受講者の属性~開始アンケートより~

11

3 「社会人のためのデータ サイエンス入門」開講実績

文系・理系の別

男女別にみた文系・理系の別 初回開講 再開講

38.4%

55.4%

6.3%

60.5%

30.1%

9.4%

0%

10%

20%

30%

40%

50%

60%

70%

理系 文系 どちらでもない

男性 女性55.9%

38.6%

5.5%

37.1%

53.6%

9.2%

0%

10%

20%

30%

40%

50%

60%

70%

理系 文系 どちらでもない

男性 女性

51.6%

43.6%

41.9%

49.5%

6.5%

7.0%

0% 20% 40% 60% 80% 100%

再開講

初回開講

理系 文系 どちらでもない

初回開講 n=6,101 再開講 n=1,819

Page 12: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

得点の状況

12

3 「社会人のためのデータ サイエンス入門」開講実績

アクティブユーザの得点分布

0

200

400

600

800

1000

1200

1~

4

5~

9

10~

14

15~

19

20~

24

25~

29

30~

34

35~

39

40~

44

45~

49

50~

54

55~

59

60~

64

65~

69

70~

74

75~

79

80~

84

85~

89

90~

94

95~

99

100点

人数

得点

(人)(人)

修了条件(58点以上)

0

50

100

150

200

250

300

350

400

1~

4

5~

9

10~

14

15~

19

20~

24

25~

29

30~

34

35~

39

40~

44

45~

49

50~

54

55~

59

60~

64

65~

69

70~

74

75~

79

80~

84

85~

89

90~

94

95~

99

100点

人数

得点

(人)

修了条件(60点以上)

初回開講 再開講

アクティブユーザーの得点の状況 初回開講では修了条件である58点以上の分布は低め。

初回開講 再開講 初回開講 再開講

平均点(算術平均) 48.5 55.0 77.4 82.9

中央値 59.5 67.0 78.0 84.5

分散 1066.8 1173.7 105.9 107.1

標準偏差 32.7 34.3 10.3 10.3

受講者数 4,943人 2,124人 2,544人 1,190人

項目アクティブユーザー 修了者のみ

再開講では課題の難易度をやや下げ、修了条件を60点以上としたところ、60点以上を獲得したアクティブユーザが増加。

Page 13: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

満足度~受講後アンケートより~

13

3 「社会人のためのデータ サイエンス入門」開講実績

23.6%

34.3%

16.0%

61.7%

62.1%

61.7%

11.7%

3.4%

13.8%

3.1%

0.3%

8.5%

0% 20% 40% 60% 80% 100%

難しかった

適切

簡単

大変満足 まあ満足 やや満足 不満

26.2%

41.3%

20.0%

60.4%

55.9%

62.5%

10.7%

2.8%

16.3%

2.7%

0.0%

1.3%

0% 20% 40% 60% 80% 100%

難しかった

適切

簡単

大変満足 まあ満足 やや満足 不満

難易度を調整したことで「適切」の割合が上昇 満足度についても「大変満足」の割合が上昇

難易度 満足度

難易度別満足度 初回開講 再開講

19.3%

38.9%

74.4%

57.9%

6.3%

3.2%

0% 20% 40% 60% 80% 100%

再開講

初回開講

難しかった 適切 簡単

35.0%

28.3%

57.8%

61.9%

6.3%

7.8%

0.8%

2.0%

0% 20% 40% 60% 80% 100%

再開講

初回開講

大変満足 まあ満足 やや満足 不満

初回開講 n=1,674 再開講 n= 725

Page 14: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

1回約10分のビデオ講義 ×1週5~6回×5週 「データサイエンス入門」を踏まえより実践的な内容へ

約1万4千人が登録

講座の概要

14

http://gacco.org/stat-japan

【内容】

第1週:データサイエンスとは

第2週:分析の概念と事例~Analysis(分析)とは、状況の把握、比較の視点

第3週:分析の具体的手法~クロス集計、散布図と相関、時系列データ

第4週:ビジネスにおける予測~回帰分析、と分析結果の報告

第5週:ビジネスでデータサイエンスを実現するために

4「社会人のためのデータサイエンス 演習」(=実践編) 開講実績

Page 15: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

15

4 「社会人のためのデータ サイエンス演習」開講実績 受講状況

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170

募集開始からの日数

(人)

(日)

受講登録数

実践編

入門編

(初回開講)

開開講

11,156人

登録締切

13,939人

日経bigデータ

掲載 7,854人ドコモプレミア

アンケート

5,985人

受講登録者数の推移

入門編=社会人のためのデータサイエンス入門 実践編=社会人のためのデータサイエンス演習

項 目 実践編(参考)入門編初回開講

受講登録者数 13,939 人 15,435 人

アクティブユーザー 2,784 人 4,943 人

修了者数 2,109 人 2,544 人

修了率 15.1 % 16.5 %

アクティブユーザーに対する修了率

75.8 % 51.5 %

受講登録者数及び修了者数

開講後の登録者数の増加率は実践編の方が緩やかに推移。

受講登録者に対する修了者の割合(修了率)は入門編と同程度であるが、アクティブユーザーに対する修了率は実践編の方が高い。

アクティブユーザー:課題に1問以上正解した受講者

Page 16: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

受講者の属性は入門編と概ね同様の傾向であるが、性別では男性がやや多く、就業状態別では「フルタイムで働いている」がやや多い

受講者の属性~開始アンケートより~

16

4 「社会人のためのデータ サイエンス演習」開講実績

男女の別

n=4,320

就業状態等の別

男性

79.0%

女性

20.4%

不詳

0.6%

フルタイム

83.7%

パート

タイム

3.5%

専業主婦

(夫)

1.3%

無職

5.5%

学生

6.0%

年代別 10歳代,

0.2%20歳代,

12.3%

30歳代,

27.5%

40歳代,

30.3%

50歳代,

20.4%

60歳代,

7.7%

70歳代

以上,

1.6%

不詳

0.2%

理系

56.2%

文系

37.2%

どちらでも

ない

6.6%

文系・理系の別 男女別にみた文系・理系の別

60.5%

39.4%

33.8%

50.7%

5.7%

9.9%

0% 20% 40% 60% 80% 100%

男性

女性

理系 文系 どちらでもない

文系・理系の別では、全体としては理系が多く、男女別にみると男性では理系、女性では文系が多い。

Page 17: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

入門編の受講状況

17

4 「社会人のためのデータ サイエンス演習」開講実績

開始アンケートでは入門編を「受講した」が半数以下であるが、受講後アンケートでは7割がいずれかの時期に入門編を受講

うち約3分の2が入門編特別開講を受講。

「演習」の前,

35.4%

実践編と

並行, 8.7%

実践編の後,

1.1%

過去に受講

済, 25.2%

受講していな

い, 29.6%受講した

46.6%受講して

いない

53.4%

実践編開始アンケート による入門編受講状況

実践編受講後アンケートによる入門編特別開講受講状況

n=4,320 n=1,428

Page 18: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

得点の状況

18

4 「社会人のためのデータ サイエンス演習」開講実績

得点の分布は入門編よりも高い範囲に偏っている。 満点を獲得したのは535人(アクティブユーザーの19.2%)

アクティブユーザの得点分布 アクティブユーザーの得点の状況

(参考)入門編得点分布

項目アクティブユーザー

修了者のみ

平均点(算術平均) 76.6 92.6

中央値 92.0 95.0

分散 914.7 79.8

標準偏差 30.2 8.9

受講者数 2,784人 2,109人

0

100

200

300

400

500

600

700

1~

5

5~

9

10~

14

15~

19

20~

24

25~

29

30~

34

35~

39

40~

44

45~

49

50~

54

55~

59

60~

64

65~

69

70~

74

75~

79

80~

84

85~

89

90~

94

95~

99

100点

人数

得点

(人)

修了条件

(60点以上)

0

200

400

600

800

1000

1200

1400

(人)

入門編(初回開講)

修了条件(58点以上)

Page 19: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

満足度~受講後アンケートより~

19

4 「社会人のためのデータ サイエンス演習」開講実績

全体の満足度は「大変満足」及び「まあ満足」で95%以上となっている。

難易度別の満足度をみると、「簡単」と回答した受講者においてやや満足度が低い割合が高い。

難易度 満足度 難しかった,

8.4%

適切

68.1%

簡単

23.5%大変満足,

41.2%

まあ満足,

54.3%

やや満足,

3.9%

不満, 0.6%

44.2%

47.8%

21.1%

49.2%

50.8%

66.4%

5.8%

1.2%

10.7%

0.8%

0.1%

1.8%

0% 20% 40% 60% 80% 100%

難しかった

適切

簡単

大変満足 まぁ満足 やや満足 不満

難易度別満足度

n=1,428

Page 20: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

対面授業の状況

20

4 「社会人のためのデータ サイエンス演習」開講実績

<内容> 「各週のおさらい」と「データ分析に基づくケーススタディ」の振り返り

演習◇テーマ:大手コンビニチェーンの既存顧客向けマーケティング担当者として、他社と比較を踏まえ現状分析を行い、自社課題を抽出 • 課題1:分析の設計 • 課題2:現状把握と課題抽出 • 質疑応答

【開催概要】 平成28年7月23日([午前の部] 10時~13時/[午後の部] 14時30分~17時30分)

• 募集定員54名のところ、約3倍の141名の応募あり。

• 当日は53名が出席。

対面授業の様子

Page 21: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

対面授業の状況~受講後アンケートより~

21

4 「社会人のためのデータ サイエンス演習」開講実績

20歳代

以下,

7.7%

30歳代,

30.8%

40歳代,

42.3%

50歳代,

15.4%

60歳代

以上,

3.8%

年代別 職種別

n=52

受講者の属性 年代別にみると40歳代が最も多く、

30歳代及び40歳代で全体の7割以上。

職種別にみると技術・専門職が半数以上

対面授業の受講動機(複数回答) 受講動機では「データサイエンスをより深く学びたかったから」が最も多い。

アンケート回答者の94%がより深く学びたかったと回答。

対面授業の受講動機(複数回答)

94.2%

69.2%

23.1%

5.8%

0%

20%

40%

60%

80%

100%

データサイエンス

をより深く学び

たかったから

スキルアップ

を目指したい

と思ったから

動画の講座だけ

では物足りな

かったから

その他

アンケート回答者数(=52人)に対する回答数の割合

管理職

13.5%

営業職

3.8%

事務職

23.1%

技術・

専門職

51.9%

その他・

不詳

7.7%

Page 22: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

対面授業の状況~受講後アンケートより~

22

4 「社会人のためのデータ サイエンス演習」開講実績

n=52 満足度 難易度

難易度別満足度

全体の満足度は「満足」及び「やや満足」で8割以上となっている。

難易度は「簡単」と回答した受講者はおらず、「適切」が半数以上となっている。

難易度別満足度は、「難しかった」と回答した受講者において、「やや不満」及び「不満」が2割程度となっている。

対面授業では、グループワークを行いたい、講評を行ってほしい等の意見も寄せられた。

満足

38.5%

やや満足

40.4%

普通

9.6%

やや不満

9.6%

不満

1.9%

32.0%

44.4%

32.0%

48.1%

16.0%

3.7%

16.0%

3.7%

4.0%

0% 20% 40% 60% 80% 100%

難しかった

適切

満足 やや満足 普通 やや不満 不満

適切, 51.9%

難しかった

48.1%

Page 23: “社会人のためのデータサイエンス・ オンライン講 …...competition, and productivity” 米国は、 24730 人、 中国は、 17410 人 、 英国は、 8340

23

5 まとめと今後の予定 課題が難しい場合でも簡単な場合でも満足度が低下する傾

向があるため、修了率を上げるためには課題の難易度が適切であることが重要。

次回の講座で学びたい内容として、「統計学の応用」や「オープンデータの活用方法」という意見が多い。

データサイエンス・オンライン講座 第3弾構築 (平成28年冬~29年春予定)

「社会人のためのデータサイエンス入門」再開講 (28年秋~冬予定)

アンケート結果を踏まえて

実践編の再開講も検討中(時期未定)