【コラム】データ分析の最強ツールはExcelとSQL(BIツール)だし、スキル習得の費用対効果も超強い
コンテンツ
【要約】ExcelとSQL(BIツール)を習得するメリットを解説している。この2つを活用すれば、データから得られるビジネス価値は8割程得られている。Python等のプログラム技術や高価な分析ツールは、成果を出す上では必ずしも必要ないことを示している。
※ 上記要約は、AI要約ツール「ELYZA DIGEST」の要約結果を利用しています。
はじまり
先日、twitterにて以下のツイートを引用させて頂いた。
完全に同意。これで事足りる会社さんはたくさんある。 https://t.co/X3845timk0
— EruTene📊国内トレンドの分析 (@furutsu_eru) August 25, 2021
この話の発端は、「データサイエンティストやデータエンジニアになる為には、どんなツールの使用方法を習得しておけば良いか」というものと、私は認識している。
この議論の中で、「pythonやRなどのプログラム言語の習得を優先すべき」といった意見や「gitやdockerなどのツールが大事」といった案も見られた。
そんな中、ツイートの引用元である、ゆうたろうさんは「Pythonの前にSQLとBIツール(Tableauなど)を推したい」と話している。
この意見に「そうだよね」と感じた現役のデータサイエンティストやデータアナリストの人は、多くいらっしゃるのではないだろうか。
企業や組織によりけりとは理解しているが、とはいえSQLやBIツールの習得が重要ということは、データをビジネスサイドで扱う人にとっては周知の事実であると思われる。
さらに言うと、多くの社会人が愛用しているExcelも使えれば鬼に金棒。
この2つを習得するだけで、あなたが熟知しているビジネスドメインにおいては、外部コンサルタントやデータサイエンティストには決して出せない有益なアウトプットが必ず出せるようになる。
Excelを使わないコンサルタントはいない
使わないコンサルも一部いると思われるが、ほとんどのコンサルはExcelを多用する。
Excelは多くのビジネスユーザが使用しており、所謂分析ツールの共通言語とも言える。
さらに、ピボットテーブルやグラフ化など、データの特徴を抽出する機能は揃っており、何よりもそれらをとても簡単に使うことができるのである。
Pythonや高価な分析ツールで出来ることは確かに多い。一方で、ビジネスサイドのユーザにとっては、too muchな面の方が目立つ。
コンサルやデータサイエンティストなど、多くのツールやプログラミングそ使ってきた分析者として優秀な人が、結局Excelに戻ってくることは多い。
Excelを多用するユーザにとっては、「Pythonや高価なツールを使えば、きっといつかビジネス成果をあげることが出来る」と考えている人も多いはず。
残念だが、そんなことはない。今、あなたが使っているExcelこそ最強の分析ツールであり、それで成果が出せないのであれば、アイデア不足や組織環境が悪さをしていると思われる。
SQLやBIツールの使い方が分かるようになれば最強
とはいえ、Excelだけだと少し物足りない。Excelでデータを分析する為には、分析する為のデータが必要である。そのデータを取得する為に、SQLやBIツールの理解が大切になる。
聞き馴染みがない単語でハードルが上がったと思う方も多いと思うが、心配はない。
SQLやBIツールはデータを抽出するときに使用する手段であり、Pythonなどと比べると習得のハードルは非常に低い。
簡単さを具体的な例で言うと、10時間もない講義を受ける、または学習をすれば、基本的な使い方は理解でき、自分の手でデータ抽出が可能になるぐらいのものである。
何かしらの資格を勉強するより断然楽であり、学習することの費用対効果は段違いで高い。
これらで取得したデータがあれば、それをExcelで分析することが出来る。ピボットテーブルを使ったり、グラフ化してみたり。これだけで、データから得られるビジネス価値は8割ぐらい得られている(割合は適当だが、温度感としてそれぐらい高い)。
SQLやBIツールを習得した人がこれから受ける恩恵
そして、SQLやBIツールでデータ習得出来るメリットはこれだけにとどまらない。
現在、予測モデルや特徴抽出などの高度な分析は、Pythonなどのプログラミング言語を通して行われることが多い。しかし、近年では、データだけ用意すれば、これら高度の分析を自動的にやってくれるAutoML(オートエムエル)と呼ばれるツールの活用が広がっている。
データサイエンティストを多く抱える大企業では、これらAutoMLを導入している企業が多く、中のデータサイエンティストが積極的にこのツールを活用している。自分でコードを書くぐらいであれば、パッと同じような精度を出してくれるツールの方が圧倒的に楽なのだ。
実際問題、これらのツールは現在非常に高価であり、使える人は一部に限られている。導入したとしても、無料のPythonで同じような機械学習は実現できる為、結局継続利用を見送るといった場合も珍しくはない。
しかし、将来的にこれらは全て無料で使えるようになるはずである。すでに、いくつかのAutoMLは無料で公開されており、簡易的にモデリングを行うことも出来ている。
私の予想としては、先5年以内に、ExcelやGoogleスプレッドシート等で、AutoMLが標準搭載されるんじゃないかなと考えている(たぶん当たる)。SQLやBIツールでデータを持ってきて、Excel上でデータを開いて、カチカチっと操作するだけで、予測モデルや特徴抽出をやってくれるようになる。今でも、重回帰分析や相関分析など、分析ツールはExcelで無料で使えているので、正直時間の問題である。
そうなってきたら、今のデータサイエンティストたちは、もっと違うポジションで自分の価値を社会に提供していくことが求められる。おそらく、データエンジニア等、データ分析を行う上で、それをクラウド上で整備する人たちが増えるんじゃないかなと思う。そして、その人たちは中長期的に大きな収益を獲得する人材になるとも考えている。
さいごに
少し話が逸れたが、この記事で書きたかったことはタイトルの通りである。話が二転三転して申し訳ないが、AutoMLがかんたんに使えるようになると書いた一方で、正直AutoMLすらビジネスサイドにとっては無用の長物である。
何度もいうが、Excelでビジネスサイドのデータ分析は事足りる。そして、SQLやBIツールで簡易的なデータ取得が出来るようになると、もはや最強である。
このレベルになると、自社のことを知らない、外部コンサルやデータサイエンティストが出すアウトプットが、大したこと無いように感じてくる(彼らはそれを大したことあるように見せるのが上手いから注意が必要)。
多くのアイデアを考え、それ立証するストーリーを作り、必要なデータを抽出して、Excelで可視化する。あとはそれをステークホルダーに提案し、実現に向けて邁進する。これを繰り返すだけである。これだけで、ビジネスサイドの人間にとっては、大きな成果をあげることが可能となる。
とはいえ、Python等のプログラミング言語を習得することは、さらにキャリアアップしたい人には有益である。Excel・SQL・BIツールなどを一通り触れた後、作業の自動化やwebアプリ開発等をやってみたい人は、是非勉強してみてほしい。

この記事へのコメントはありません。