データサイエンティストのひよこ

分析に関する日々の相談事項

データサイエンスに関連する資格

データサイエンティスト協会のデータサイエンスの資格に注目したい。

↓データサイエンティスト検定™ リテラシーレベル
www.datascientist.or.jp

データサイエンティスト協会から出た話題としては個人的に興味を持ったのと、私が資格が好きでちょうどよいので、DS関連の資格についてみていきたい。


さて、データサイエンス業界でも、一昔前に比べて資格がそろってきた。企業でもデータサイエンススキルの客観評価に、資格を利用しようという動きがあって、少し前から巷の資格についてまとめようと思っていた。

まず、前提としてIT業界と同じくデータサイエンス業界でも、資格取得で何かキャリアが激変するほどのことはない。企業側と個人側でその重要視するところは異なるが、個人側としては、自分のスキルや努力したい方向を客観的に他人に示せる形になること、特に、データサイエンスの職に就きたいが、学歴や学部が文系寄りでスキルを示しにくいといった学生には、良いかもしれない。逆に、企業側はスキルを評価するときに、個人を見ずに資格を見て評価することができるので人材選定の負担を下げることができる。大手の企業への採用を考える人材には、資格は有用なツールとなるだろう。

実際のところ、調べてみると無数のデータサイエンス関連資格があった。全く無名の団体が行うものもあり、すべてを評価しきれなかったものの、可能な限り受験もしてみた。どのような試験で、何が問われているか、どれくらい難しいのか、を簡単に紹介したいと思う。私見として各スキルがどのレベルまで問われる試験かを5段階で表にまとめたが、「対策の難度」「問題の難度」「合格基準」で資格試験の総合的な難しさは変わってくる。たとえば、試験範囲がめちゃくちゃ広く、1つ1つの問題で問われるレベルが高いが、合格基準があまく合格者が多いといった試験も非常に多い。そのため、ここでは、「問題の難度」のみで、数値を付けた。なので、数値の高いほど試験全体の価値が高いというわけでもない。また、サイエンス分野でも、問われている領域が統計なのか機械学習なのかでも当然異なる。

資格名 Biz Eng Sci 備考
データサイエンス検定 DS協会主催の最近できた試験。より高度な資格の創設も待ち遠しい。★オススメ
Certified Analytics Professional (CAP) 米国OR学会の比較的長い歴史を持つ資格。ビジネスケースも含めた問題が出るので、DS検定の英語版に近いとは思う。機械学習的な知識はあまり問われない。★オススメ
DATA SCIENCE COUNCIL OF AMERICA (DASCA): SDS DSの新興団体が行う試験。個人的には資格ビジネスがメインのような団体とみられるので、オススメしない。
JDLA:G資格 深層学習に関する手法の発展の歴史などが問われ教養的側面が強い。これに合格する程度では、話の上でついて行けるようになるぐらいで、モノが作れるようにはなれないと思う。合格者に対する集会などが多く、同業の横のつながりがあるので、ビジネスマン的にはこれで十分かもしれない。
JDLA:E資格 機械学習/深層学習に関する基礎知識やPython実装の知識が問われる。受験のために講習を受けなければいけないので、大変だが実際の試験は深層学習以外の得点で合格している人が多いように思う。G資格と同じで、合格者に対する集会などが多い。★オススメ
統計検定:2級 実務の範囲では2級まででよいと思う。機械学習/深層学習についてはほとんど出ず、数学の問題が解けるスキルが問われるので、実務的なスキルにはつながりづらい。
AWS認定:機械学習 AWSベンダー試験。他のAWS試験に比較して、機械学習の知識の比重が高いが、ベンダー試験なのでAWSのサービスについての固有の知識が問われる。
アクチュアリー:数学 統計検定2級に限りなく近い形式の試験だが、難易的にはより高くなっている。本来、DSとは関係のない領域だが、職務上、統計の知識が問われる職種として、一定の共通知識はあると思う。
ITストラテジスト 高度情報処理技術者試験の一つ。ここに含めるか悩んだが、午前問題の一部で機械学習がでてくるようになった。かなり上流の役割を求められるので、ビジネスと言っても経営層や企画向けの内容となっている。
Webアナリスト Web解析や広告解析を主要ドメインとしている。機械学習などのデータ分析の部分はほとんど触れられていないが、当該ドメインについて用いられる簡単な統計などは紹介されている。受験してみたが、予想以上に団体のテキストが整理されていた。

各試験の概要を簡単にまとめた。結構大変だったので、今回はここまでの記述として、いつか追記を行いたい…。

資格試験の特徴として、単純にスキルの深さを検定するものであるが、それに加えて、資格に向けた教材講習ビジネス、資格保有者のコミュニティビジネスを行っているようなものも多かったので、資格の意味合いをよく理解して受験したほうが良い。


データサイエンス検定

概要
データサイエンティスト協会による最近発表された資格試験である。第1回の試験が最近実施されたため、今後公表される情報をぜひとも確認したい。国内のDS資格としては、公的な存在として認知されることが期待されるため、企業などでのアピールにはつながるだろう。個人的には、今後登場するハイレベルな検定は、ビジネス・エンジニア・サイエンスを分けて、それぞれでディープなものにしてほしいと思った。中途半端に全部がバランスよく出るような問題だと、何も問えないタイプの試験になりそうな気がする。合格者に対して、とくに特典等がないので、純粋なスキル客観化を目的に受験する。
難易度
DS協会のスキルレベルリストに合わせると、リテラシーレベルとなり、入門レベルと考えられる。
問題内容
択一式。

Certified Analytics Professional (CAP)

https://www.certifiedanalytics.org/

概要
The Institute for Operations Research and the Management Sciences(INFORMS)とよばれるオペレーションズリサーチを中心とした学会が行う資格試験である。試験をうけるには、かなり細かくスキルや所属を申告&提出する必要があり、またその内容への確認が入る。受験料が高く、受験回数に制限があるため、海外におけるデータサイエンスのベンダーフリー試験としては、質やコミュニティはそこそこ良いほうだと思う。ORを出自とした団体であることから、モデリングに関しては意外とちゃんと問われるため、サンプル問題で用語くらいは事前にチェックしたほうが良い。データサイエンティスト検定の英語版という表現が最もよく当てはまると思う。
難易度
すべて英語で行われる。アナリティクスとあるので、統計が深く問われ、機械学習やAIは浅い。数式は出てこないが、簡単な計算はでる。参考書等がほとんど存在しないため、対策がしにくいという難しさがある。
問題形式
CBTで択一式であるが、試験時間が2時間あり長い。アナリティクスという観点で、主にケーススタディと統計が出題されるので、エンジニアの観点での問題はほとんどない。機械学習やAIについては問題数が少なく、最近の話題に上がるような内容は少なめと感じた。

DATA SCIENCE COUNCIL OF AMERICA (DASCA): SDS

https://www.dasca.org/

概要
DATA SCIENCE COUNCIL OF AMERICA(DASCA)と呼ばれる団体が行う、Senior DataScientist(SDS)と Principal DataScientist(PDS)の区分があり、団体が持つBoKをもとに試験が構成されているようである。SDSは実務経験7年、PDSは10年を目安に受験ができる。現在BoKが更改中のようで後者のPDSが、一時的に受けられなくなっている。申し込みをすると、団体から書籍が送られてきて、その内容に基づいて試験が行われる。団体の教材が、とにかく巷の書籍と比べて内容がずれていると感じた。加えて、試験の内容はデータサイエンスの知識というよりも、テキストに書いてある細かい内容を選択肢から選ぶような問題だった。たぶんデータサイエンスの数ある試験のなかでも、この試験でしか問われないであろう範囲や内容が出てくる。この資格は取らなくて良いと思う。
難易度
すべて英語で行われる。他の書籍には(悪い意味で)書いてないようなものが問われるため、非常にとっつきにくく、あまりデータサイエンスのスキルとは関係ないように思えた。
問題形式
択一式のウェブテスト。団体のBoKをもとにした教材をもとに行われる。ビジネス・エンジニア・サイエンスとどれも均等にでる。

一般社団法人日本ディープラーニング協会(JDLA):G資格、E資格

概要
G資格はAI周辺の教養が問われる試験、E資格は、諸々のAIの原理や実装力が問われる試験である。昨今、受験者数が増えてきて、一定の認知がある人工知能系の資格となってきている。E資格は、事前にJDLA認定の講習を受けなければならず、この受講料が非常に高額である。特に、論文を参考文献とする原理原則からPython実装まで幅広く問われるので、少し出題範囲に広さに驚くかもしれないが、受験層の知識レベルが高いのか基準が甘いのか…合格率7割をこえるなど、合格基準・難易度については推定しにくい状況となっている。合格者同士のコミュニケ―ションが交わされているようなので、社外のコミュニティを求める人には魅力的かもしれない。
難易度
応用数学機械学習、深層学習、開発環境の4分野から出題されるが、出題比率は均等ではないように思う。特にE資格は、過去試験傾向によると、応用数学機械学習で点を稼いで合格する人が多い。
問題形式
択一式のウェブテスト。

統計検定

概要
国内の統計関係の団体が複数関わる試験。実務で使う標準的な範囲なら2級まででよいように思う。統計という限定された範囲が問われる試験なので、データサイエンスの全体感としては少し物足りないが、他のデータサイエンス系資格が、理論的な理解を問うものや記述式試験としての出題がないため、スキル証明としては非常に確度の高い資格である。同団体がデータサイエンス資格も発表しているが、同様のコンセプトで行われる試験なら、サイエンス系の資格としては高位に位置づけられる資格になることが期待される。
難易度
2級は、分布、推定、検定、回帰といった標準的な出題となる。実装などは問われないため、理論的な理解が重要となってくる。
問題形式
ペーパー試験と択一式のウェブテスト(CBT)が両方開催される。合格証にはCBTかどうかが記載される。

AWS認定:機械学習

概要
Amazon Web Service認定資格のうち専門知識:機械学習とよばれる試験。AWSベンダー試験であるため、機械学習の知識に加えて、AWSに関する知識が必要となるが、ほかのAWS認定資格よりも機械学習領域の知識で対応できるものが多いように思う。合格者は、AWSのイベントで特設ブースに入れたりと、特典が存在する。が、それほどのメリットはなかった…。AWS関係の資格や技術はどちらかというとエンジニア向けだが、データサイエンティストとしても彼らとコミュニケーションする上では重要となってくると考えている。クラウドベンダー資格であれば、Google Cloud Platformに関するものもあるので、会社や仕事でなじみのある資格を受験することをまずはオススメしたい。
難易度
機械学習に関しては、標準的な知識が問われるが、AWS機械学習や深層学習を利用したクラウドサービスの概観とその利用を知る必要がある。実際に、いくつかのサービスを触ってみることとまとめ資料を作ることが重要である。
問題形式
択一式のウェブテスト(CBT)で行われる。

アクチュアリー:数学

概要
保険数理の資格試験の一部として行われている数学(主には統計)の試験である。この資格と次の資格はデータサイエンティスト協会の記事に、データサイエンスに関係する資格として紹介されている(いた?)ものである。昨今ではその認識は少し薄れてきているように思うが一応調べてみた。データサイエンス向けに構成された試験ではなく、機械学習のような範囲までの知識は問われないので、非常に限定された範囲の試験と感じる。一方で、難易はそれなりにあり、統計を必要とする職種といえどもデータサイエンティストとしてこの資格を狙うことは、よく検討したほうが良いと思う。合格すると、日本アクチュアリ協会研究会員になれる。
難易度
出題傾向は、統計検定と非常によく似ているが、確率モデルなども出題されるため、取り扱う範囲は少し広い。
問題形式
ペーパー試験。

ITストラテジスト

概要
高度情報処理技術者試験の一つとして行われている、ITシステム投資や経営層とのコミュニケーションなど、超上流に関わるスキルが問われる試験である。データサイエンティストに関わる試験かと質問されたら、現時点ではそうではないとは思う。ただ、ここ数年データサイエンス・AIに関わる問題内容が頻繁に出題されるようになってきて、今後の動向に注目したいと思っている。特にデータサイエンティストも注目されてからそこそこの年月が経ち、超上流の工程に関わる人材も増えてきているなかで、ほかの資格とは毛色の違う視点でデータサイエンスが問われる試験となっているため、一つの選択肢として挙げておきたい。
難易度
経営、会計、財務などを背景にITシステムの企画や投資評価など知識が問われる。データサイエンスがメインに問われるわけではないので、ここに挙げるには適切ではないかもしれない。
問題形式
ペーパー試験。選択式と記述式・論文式で行われる。

Webアナリスト

概要
Webアナリスト協会が行う試験である。個人的にWebアナリストの知人がいて紹介していただいた資格でノーチェックだったのだが、試験をうけるための協会が用意する教材が非常によくまとまっていると感じた。Web広告、Web解析の原理からその標準的な手法の解説が中心で、400ページ超の教材となっていて、非常に教育的であると感じた。機械学習系の話題は残念ながらないが、データサイエンティストでもWeb広告ドメインに特化する場合は一見するのも良いだろう。
難易度
Web広告の原理、指標、分析などをはじめ、400ページを超える重厚な教材ではあるが、標準的な問題が多い。
問題形式
択一式のウェブテスト。

以上、データサイエンス検定以外はすべて受験したものであるため、詳細な事項が知りたい場合は個別にtwitterとかにコメントいただければと思う。