模擬試験問題はこちら
データサイエンティスト検定™(DS検定™)は、数理・データサイエンス・AIにおけるモデルカリキュラムを総合し、実務能力と知識を有することを証明する試験です。
国家資格
|
公的資格
|
民間資格
|
業務独占
|
名称独占
|
必置
|
試験情報
基本情報
申込関連 | |
---|---|
試験日 | 年3回(3月、6月、11月) |
申込期間 | 概ね試験期間開始10日前まで |
受験料 | 一般 11,000円(税込) 学生 5,500円(税込) |
受験資格 | 特になし |
申込方法 | 申込サイトよりWEB申込 |
試験関連 | |
---|---|
試験方式 | CBT(@所定の試験会場) |
試験時間 | 100分 |
出題形式 | 選択式 |
出題数 | 100問 |
合格基準 | 正答率約80% |
合格発表 | 試験日の約1ヶ月後 |
試験内容
スキルチェックリストの3カテゴリ
- データサイエンス力★1
統計数理基礎、線形代数基礎、微分・積分基礎、回帰/分類、評価、検定/判断、グルーピング、性質・関係性の把握、サンプリング、データクレンジング、データ加工、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、アプローチ設計、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、機械学習、時系列分析、言語処理、画像処理、動画処理、音声/音楽処理、パターン発見 - データエンジニアリング力★1
システム運用、システム企画、クライアント技術、通信技術、基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、クレンジング処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、データインタフェース、分析プログラム、SQL、基礎知識、攻撃と防御手法、暗号化技術 - ビジネス力★1
ビジネスマインド、データ倫理、コンプライアンス、契約、MECE、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、KPI、スコーピング、データ入手、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント
数理・データサイエンス・AIにおけるモデルカリキュラム
- 社会におけるデータ・AI利活用
- 社会で起きている変化
- ビッグデータ、IoT、AI、ロボット
- データ量の増加、計算機の処理性能の向上、AIの非連続的進化
- 第4次産業革命、Society 5.0、データ駆動型社会
- 社会で活用されているデータ
- 調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
- 1次データ、2次データ、データのメタ化
- 構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
- データ作成(ビッグデータとアノテーション)
- データのオープン化(オープンデータ)
- データ・AIの活用領域
- データ・AI活用領域の広がり(生産、消費、文化活動など
- 研究開発、調達、製造、物流、販売、マーケティング、サービスなど
- 仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
- データ・AI利活用のための技術
- データ解析:予測、グルーピング
- データ可視化:関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など
- 非構造化データ処理:言語処理
- データ・AI利活用の現場
- 流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介
- データリテラシー
- データを読む
- データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
- 観測データに含まれる誤差の扱い
- 相関と因果(相関係数、擬似相関、交絡)
- 母集団と標本抽出(国勢調査、アンケート調査、全数調査、単純無作為抽出、層別抽出、多段抽出)
- 統計情報の正しい理解(誇張表現に惑わされない)
- データを説明する
- データの図表表現(チャート化)
- データの比較(条件をそろえた比較、処理の前後での比較、A/Bテスト)
- 不適切なグラフ表現(チャートジャンク、不必要な視覚的要素)
- 優れた可視化事例の紹介(可視化することによって新たな気づきがあった事例など)
- データを扱う
- データの集計(和、平均)
- データ・AI利活用における留意事項
- データ・AIを扱う上での留意事項
- 個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト
統計情報
試験対策
対策方法
DS検定の試験範囲は『スキルチェックリスト』によるものと『数理・データサイエンス・AIモデルカリキュム』によるものの2本立てになっています。ただ大半は『スキルチェックリスト』に沿った出題であり、重複部分も多いため、基本は『スキルチェックリスト』を中心に考えて良いでしょう。
『スキルチェックリスト』は、「データサイエンス力」「データエンジニアリング力」「ビジネス力」からなりますが、半数近くは「データサイエンス力」から出題されると思われますので、この分野に最も注力すべきでしょう。
なお、DS検定を受験される方は、ITパスポートや基本情報技術者などの情報処理技術者試験に挑戦されている(または合格済みの)方が多いと思いますが、「データエンジニアリング力」は情報処理試験のテクノロジ分野、「ビジネス力」は情報処理試験のマネジメント分野、ストラテジ分野の知識と大部分が重複していますので、対策は容易(あるいはほとんど不要)と思われます。
ただ、新しい資格であり不明な点も多いため、最初は以下の公式テキスト(リファレンスブック) 第2版を頼りに、学習していくことが望ましいでしょう。(新たに問題集も出版されました!)
ある程度知識が定着しましたら、当サイトに模擬問題(練習問題)を用意していますのでぜひご活用ください。
【PR】参考書・問題集
著者:菅 由紀子/佐伯 諭/高橋 範光/田中 貴博/大川 遥平/大黒 健一 他
出版社:技術評論社; 第2版 (2022/5/14)
出版社:技術評論社; 第2版 (2022/5/14)
著者:スキルアップAI株式会社 小縣 信也 斉藤 翔汰 他
出版社:インプレス (2022/4/21)
出版社:インプレス (2022/4/21)
【PR】スクール・講座
模擬試験問題
準備中
リテラシーレベル
データサイエンス力
- 基礎数学①
- 基礎数学②
- 基礎数学③
- 基礎数学④
- 基礎数学⑤
- 基礎数学⑥
- 基礎数学⑦
- 基礎数学⑧
- 基礎数学⑨
- 基礎数学⑩
- 予測①
- 予測②
- 予測③
- 予測④
- 検定/判断①
- 検定/判断②
- 検定/判断③
- グルーピング①
- 性質・関係性の把握①
- サンプリング①
- データ加工①
- データ加工②
- データ加工③
- データ可視化①
- データ可視化②
- データ可視化③
- 分析プロセス①
- データの理解・検証①
- 意味合いの抽出、洞察①
- 機械学習技法①
- 機械学習技法②
- 機械学習技法③
- 機械学習技法④
- 機械学習技法⑤
- 機械学習技法⑥
- 機械学習技法⑦
- 機械学習技法⑧
- 機械学習技法⑨
- 機械学習技法⑩
- 時系列分析①
- 言語処理①
- 画像・動画処理①
- 画像・動画処理②
- 音声/音楽処理①
- パターン発見①