見出し画像

データを駆使して宝を掘り起こす〜データサイエンティスト・赤池嵩文〜|月イチ!カケハシさん

こんにちは、カケハシ公式note編集部の鈴木です。

2016年の創業以来、事業をつくる仲間を増やしてきたカケハシ。気がついてみると社員数は300名を超えており、プロダクト数もチーム数も昔とは比べ物にならないほどに拡大しました。

そこでカケハシでは、社内Podcastとして「カケハシラジオ」を公開。ブランディングチームの上田恭平さん、鈴木啓祐さんの二名をラジオパーソナリティとして、日々さまざまな配信を行っています。

そのなかでのメインコンテンツの一つが、一人のメンバーをゲストに迎えてお送りする「月イチ!カケハシさん」。カケハシとの出会いや仕事を進めるうえで大切にしているスタンスなど、メンバーの人柄を紐解く時間をつくっています。

さて、そんなわけで、これまでは社内だけで公開していたカケハシラジオですが、せっかくなので「月イチ!カケハシさん」をnoteでもおすそわけする運びとなりました。今月もカケハシラジオの世界を覗き見していきましょう。今日はどんな話が飛び出すのでしょうか、それではさっそくどうぞ!



上田恭平(以下、上田):今回もはじまりましたね。このラジオを聞いてくれているメンバーはどのくらいいるのかなと思いつつの最近ですが、実は収録機会は頻繁になってきているんですよね。どんどんいろいろな方を呼んで話を聞いてみようと思っています。

今回は、前回の全体会議でリレースピーチを担当してくださったこの方。「Musubi AI在庫管理」チームでデータサイエンティストとして活躍されている、赤池嵩文さんです。

赤池嵩文(以下、赤池):はーい、赤池です。よろしくお願いします!

鈴木啓祐(以下、啓祐):よろしくお願いします!

上田:赤池さんには、データサイエンティストというお仕事の話や、今に至るまでのバックグラウンドのこと、それから少しご自身のパーソナルなことも含めてあれこれ伺っていきたいなと思っています。では、赤池さんのご紹介を簡単に。

もともと大学時代は小学校の先生を目指していたとのことですが、途中で経済学専攻に変更。そこでデータを触ることに面白さを感じて、データサイエンティストのキャリアを歩まれることになったそうです。

新卒ではワークスアプリケーションズ、その後は帝国データバンク、AIベンダーのAlbertや人材系の会社などで経験を積まれて、2021年にカケハシにジョイン。ご家庭では2歳の男の子を育てる、良きパパでもあるというわけですね。

先日の全体会議を終えたあと、「赤池さんのキャリアや考えを聞く機会がなかなかなかったから知れてよかった」というコメントがあったりと、スピーチから刺激をもらった人も多かったのではないかと感じています。

赤池:それはよかった。とても嬉しいです。

上田:コロナ禍での入社ですし、業務上で関わるメンバー以外はなかなかコミュニケーション取る機会がなかったですよね。

赤池:そうですね。それもあるし、入社して最初に入ったのが新規事業のチームだったので、やっていることを社内外問わず外に出せなくて。それゆえに、あんまり他チームとの交流ができていなかったかもしれないです。ひっそりと働いていました(笑)。

上田:プロジェクトがたとえひっそりせざるを得ない状況だとしても、そこで働いている人までひっそりしちゃうのは少し残念なところでしたよね。そのあたりのコミュニケーションを設計できなかったという意味では、僕ら自身の反省でもあるんですけれど。

赤池さんのリレースピーチを振り返ってみると、分析のための分析ではなく、カタチにすることを目的としたデータ分析なんだなっていう点が特に印象的でした。

僕たちもものづくりをやっている側ですけれど、同じような課題があるなと。ただなにかを作ればいいわけではなく、「なんのためにやっているんだっけ?」を常に自分に対して問うことがすごく大事なんですよね。あらゆる職種に通じる教訓だったんじゃないかと思っています。

赤池:ありがとうございます。

上田:そんなわけで、おさらいはこのくらいにして、さっそくいきましょうか。赤池さんってどんな人なんだろうっていうのを深掘りするために……まずはSlackのアイコンについて触れてもいいですか?

上田:めっちゃギター弾いてるじゃないですか。照明も赤いし……これステージってことですよね?

赤池:そうですね、学生時代の最後の卒業ライブのときの写真です。なので、10年くらい前の写真を未だに使い続けているってわけなんですけれど(笑)。

上田:いいじゃないですか、ガチでやっていたんですね。

赤池:楽しみながらではありますけれど、一生懸命やっていましたね。ただ、レコーディングして……みたいなガッツリ感はないですよ。

上田:いや〜いいな。あ、音楽といえば、啓祐さんは黙っていられないと思いますがどうですか?

啓祐:はい(笑)。僕もアイコンはこんな感じですし。

上田:赤池さんはどんなジャンルの音楽をやっていたんですか?

赤池:学生時代に入っていたのはビッグバンドのサークルなんですよね。ちょっと古いかも知れないですけれど映画の『スウィングガールズ』的な感じといいますか。『A列車で行こう』とか、そういう音楽です。

吹奏楽みたいな編成でジャズをやるっていうのがビッグバンドなんですけれど、その派生で、大学のゴスペルサークルのバックバンドだったり、ときどきまったく関係ないジャンルをやってみたりとか。

もともと好きなのが90年代のヴィジュアル系、ヘヴィメタル、ハードロックなんですけれど、ときどきアルゼンチンタンゴを聞いたりもしていて、幅広くいろいろな音楽に触れていましたね。

上田:こういう趣味からつくれる接点ってたくさんあると思うのでね、ぜひつながっていきましょうよ。


データサイエンティスト=データに関するなんでも屋さん?

上田:はい、ではそろそろ、今日のメイントピックに話題を移していこうと思います。というのも、データサイエンティストっていう職種がここ数年で一気に増えてきている状況下ですが、実際にデータサイエンティストと接したり、仕事で関わる機会って、僕自身はそう多くなくて。

カケハシ社内にもデータサイエンティストの方はたくさんいるんですけれど、ぶっちゃけどういう仕事をしているんだろうっていうのを知りたいなと思ったんです。なにより僕はまだまだデータサイエンティストに対する理解がまだまだ浅い人間なので、この機会に教えてもらいたいなって思っています。

赤池:ぜひぜひ、わかりました!

上田:カケハシでも、データサイエンティストの人数やデータを取り扱うチームってどんどん増えていますよね?

赤池:そうですね。わかる範囲でいうと、チームにデータサイエンティストが固まっているパターンもあれば、さまざまな職種の人が集まるチームの一人がデータサイエンティストってパターンもあるかなと思います。なので、ポツリポツリと増えてきてはいるのかな。

上田:そうですよね、だからこそちゃんとわかっていないとって思って。なんか世の中の流れ的には「これからの時代、データっしょ」とか言っておけばなんとかなりそうなもんですが、そのためにはちゃんと理解しておきたいなって思って(笑)。なので先生、よろしくお願いします!

スッと静かにしてますけれど、啓祐さんも似たようなところ、あるんじゃないですか?

啓祐:いや、僕は「これからの時代、データっしょ」って言いたいわけじゃないですよ(笑)。ただ、データサイエンティストの方に対して、漠然と「すごいな」っていう印象だけがある状況なのは事実ですね。だから、どういうことをやっているんだろうって純粋に興味があります。

上田:そういえば先日、赤池さんのリレースピーチを聞いていて「そうなんだ!」と思ったことがあって。僕、データサイエンティストって勝手にソフトウェアエンジニアリングから派生する仕事だと思っていたんですよ。

だから、分類として正しいのかわからないんですが、理系の人が就く職業だろうと。でも、赤池さんって先生を目指していて、その後も経済学専攻ですよね?

赤池:ふらりふらりと、気づいたらって感じですけれど、そう言われてみると……。

上田:だから、どういうバックグラウンドの人たちが今データ系の仕事に集まってきているのかを、まずは知りたいなと思ったんですよね。

赤池:そうですね、コードを書いてデータを扱う仕事全般ということでしたらデータサイエンティスト以外にも研究開発系の職種やDB関連のエンジニア、機械学習エンジニアなどがいらっしゃいますが、そのような広いくくりのなかではエンジニア色の強い方々が多数派と想像してます。

しかしデータサイエンティストに絞ると、主な業務がデータや統計学、機械学習などでものごとの仕組みを探ったり予測することなので、僕の今までの同僚には学生時代にそういった知識や技術を身につけた方が多かったです。

とはいえ、社会人になってから学んだという方もいらっしゃったりするので、学生時代にデータ分析を身につけることは必須ではないと思います。なので、学生時代からデータに触れていてデータサイエンティストをされている方でも、バックグラウンドは人によってずいぶん異なる印象です。

上田:へえ、なるほどなあ。統計学とか、いわゆる膨大なデータをなんかしらのかたちで扱ったことがあるとか、研究領域の兼ね合いで触れざるを得なかったみたいな方もいらっしゃるんですね。

赤池:僕の専攻していた経済学では、あまり大きくないデータを取り扱うケースが多かったんですよね。たとえば、国のGDP分析みたいなものは、データ数は多くないじゃないですか。しかしデータ分析の実務では、システムから出力されたユーザー単位やユーザー×日付・時間単位などのレコード数が多い、いわゆるビッグデータを扱うこともしばしばあります。

そうすると、たとえばExcelでデータをハンドリングできなかったり、そもそもローカルPCで処理するには大きすぎるケースもあるんですよね。そういう問題にぶつかったときに、必要に応じてあとからエンジニアリングの知識を学ぶ必要がありました。

逆に、社会人になってからデータ分析を学んだエンジニア出身の方の場合は、あとから数学とか統計学、機械学習とかの知識を身に着けて、データサイエンティストとして活躍していくようなイメージです。

上田:なるほど。

赤池:データを取り巻くあらゆる知識が切っても切り離せない仕事なんですよね。たとえば、とある予測モデルをつくるとします。それを活用するとなったとき、結局それって、予測結果を人に見せるだけではなく、なにかしらのシステムに組み込むケースがほとんどですよね。

そうすると、組み込むシステム側のことをわかっていないと、それって対応できないじゃないですか。そういうわけで、なんだかんだソフトウェアエンジニアリングの知識や技術が必要になってくるっていう。

案件によりますが、データサイエンティストとして仕事をしてみると、データ分析やエンジニアリングにまつわる知識を、結構幅広く求められるなって感覚がありますね。

そういった知識や技術がないと、そもそも分析業務で成果を出しづらいというか。そんな職種なのかなと思います。

上田:なるほどな〜。必要に迫られるかたちで、エンジニアリングや統計学などのスキルを付加して業務にコミットしていくイメージなんですね。

赤池:そういうイメージです。ちなみに僕がデータサイエンティストの職種に就いたのは2016年なのですが、そのころは職種がさほど細分化されておらず、今以上になんでも屋だった印象があります。

あくまでも私見ですが、当時は今よりもデータサイエンティストの業務範囲がざっくりしていて、さらに世間的に言葉として流行するも「なにする人なの?」というのを企業側もあまりわかっていないケースもあったように感じます。最近では、年々職種が細分化されて業務内容が絞られてきたように感じているんですよね。

上田:じゃあ昔は、「データを整理(処理)してほしい」というオーダーを社内で受けて、それに対応することが多かったんですかね?

赤池:企業ごとの「データを使った稼ぎ方」の方向性によるかなと思いますが、そういうこともありました。

以前在籍した企業では、自社保有のデータを活用した独自の分析方法が確立されていたり、データを前処理すること自体で収益を得ていたという背景がありまして、データこそ扱うものの統計学や機械学習はほとんど使わない時期もありました。

それから先ほどの「なにする人なの?」の中身ですが、データサイエンティストの専門知識や技術を活かすと、何かの値や状態に関する予測や分類のモデルを作ったり、ある結果に対する影響力や効果を推定したりすることができます。

たとえばさっきのGDPの話でいうと、前者については今後のGDPの値の予測、後者についてはGDPをあげたり下げたりする要素の推定というイメージです。

そういった予測や分類の対象として、目的次第では行動のログデータ以外にも画像や動画、音声データなどを取り扱うこともあります。

上田:そういう仕事もデータサイエンティストの領域になるんですね。

赤池:そうなんですよ。なので、データサイエンティストといっても仕事内容はバラバラなのかなと思います。アプリに組み込むためのデータ分析をするケースもあれば、意思決定をサポートするためのデータ分析もあるといった具合で、なかなか幅広いです。先ほどの話とリンクしますが、だからこそデータサイエンティストのバックグラウンドは多様なのかなと。


きれいな水じゃないと泳げない! データサイエンティストが重要視する「データの質」とは?

上田:カケハシに限定すると、データサイエンティストとして赤池さんはどういった仕事をしているんでしょうか。「Musubi AI在庫管理」に関わる仕事が主だと思いますが、どのようにプロダクトと関わっているのだろうと思い……。

赤池:今所属しているのは、在庫管理における予測のシステムを改善して運用していくチームなんですよね。

上田:薬局のなかにある、医薬品在庫の増減を予測するってことですよね。

赤池:そうですね。その予測をなるべく正確に行えるように改善を重ねていて。「明日この患者さんがくるだろうから〇〇(薬剤名)の在庫を確保しておこう」とか「一週間後に〇〇がこれくらい出そうだから発注したほうがいいな」とか、そういった予測の精度を上げるような仕事をしています。

特に僕がミッションとして認識しているのは、その予測モデルを高度化すること。具体的には、誰がいつ来るのか、どれだけの薬が必要になるのかなど、そういった内容が寸分違わず当たるようになれば、すごく使いやすい「Musubi AI在庫管理」になると思うんです。

そのなかで、まさに現在取り組んでいることでいうと、予測モデルを構成する各種予測モデルを複数の観点から評価する仕組みづくりに注力しています。

具体的には、予測の整合性や在庫回転率を計測することで、どういう患者さんに、どういう薬を処方される予測の精度が高いのかがわかる。すると、改善点も今よりピンポイントにわかるので、精度の向上につながると考えています。

上田:予測精度を高めるための取り組みをされているということですね。具体的な実作業って、どういったことをされているんでしょう?

赤池:そうですね。どういう指標を用いて予測モデルを評価するのかチームで話し合ったり、それをどうクエリで書いて実装すればいいのか検討して、そうして実行したものをまた再評価してっていう流れで進めています。

なので、現時点ではモデル精度を向上するための準備段階といいますか、アクセルを踏み込むための地盤づくりを行っているような状態ですね。

啓祐:なるほど。僕も専門領域はデザインなので、数値化しづらいものや感覚的に評価しがちなものを、定量的に評価できるよう考えることがあって。そのあたりは、すごく似ているなと思って話を聞いていました。たとえば、デザインの説得性を持たせるために、A/Bテストのような数字を頼りにする場面ってあるので。

赤池:そうですね。WebのUI改善のためにA/Bテストをする場合、データを使えば「こっちの案を採用すれば、このくらいクリック率が上がります」っていうのを細かく分析して、改善することもできるんですよね。実際に手を動かして分析するっていう段階をしっかりと組むことが、プロダクトやサービス開発においては結構重要だなと感じることも多いです。

啓祐:データの使い方として正しいのかはわからないんですが、デザインの比較の際、A/Bテストをしても有意差はないっていう結果になることも多いんです。そうした際、それなら「見た目のいいほうでいきましょう」っていう判断ができたりする。

もちろん、数字として差が生まれるならそれを参照して実装すればいいと思うんですけれど、どっちでもいいことが数字としてわかると、見栄えで選べるので、そういう意味でもデータによって評価するのはすごくいいなと思いました。みんなが納得するというか、合意形成がしやすいですよね。

上田:赤池さんとしては、現段階で行っているモデルの改善に関して面白さ、やりがい、手応えって感じていますか?

赤池:そうですね。僕は今のチームに移ったのが半年くらい前なんですけれど、まだまだ既存モデルを良くするための取り組みまで手が届かないというか、準備段階だなっていう感覚です。なので、結構今が頑張りどころだなっていう気持ちですね。

上田:そっか、そっか。本来やりたいことを考えると、まだ遠い場所にいるような思いなんですかね。

赤池:なんというか、データサイエンティストの仕事の難しいところなんですけれど、データ分析を行うためにお膳立てされた環境をまずつくらないといけないって話があるんですよ。きれいな水じゃないと生きられないみたいな、そういう儚さがあるんですよね。

特に分析の成果物をプロダクトに組み込む場合だと、データそのものがちゃんと理解しやすいかたちで管理されていて、きれいなまま定期的に更新されていて……っていう状況が必要不可欠なんです。

というのも、モデルの運用までを考えると「なんか精度がいいモデルができました! はい、これでこのプロダクトのモデル構築は完全に終わりで〜す!」とはいかなくて、継続的なモデルの改善が必要になると思います。そのあたりの環境をつくるには、データを整える人、分析する人、組み込む人って感じで、しっかりと体制を敷かないといけないなと。

カケハシに限らず、そういった環境を充実させるのはなかなか大変なんです。だから、まずはそこをちゃんと整備しなければならない。大変であり課題であり難しい点ですけれど、挑戦しがいもあるので楽しいですよ。

上田:なるほど。要するに、計画を立てることも集まったデータの整理も、作業しながら行っていかなければならないんですね。手を動かす時間が長いなかで、どのように折り合いや優先度をつけて仕事を進めていくのかが難しいのかな。カケハシにとっては、課題の一つであり、伸びしろでもあるってところなんですね。

赤池:そうだと思います。それに、カケハシには複数のプロダクトが存在するので、予測精度を向上するための変数として使えるデータが、他のプロダクトにもあるのかもしれない。そういったデータ間の連携ももっと進んでいくといいなと思っています。そうすることで、プロダクトの精度向上はもちろん、やりがいもより増えていくだろうなと。

上田:いや、本当にそうですよね。今後のカケハシが注力するべき方向性としては、プロダクト間でのデータ連携、相互活用が本当に大切になってくるだろうなと思いますし。

赤池:そうですね。やっぱり、ただ一つのデータからなにかを分析してっていうだけではなく、複数のデータを用いて分析したり予測するうえではデータの整備が必要です。その意識が全社的に芽生えるのとそうでないのとでは差がありますし、データ活用がプロダクト間で行えるようになればスムーズに進む話もあるかもしれないなと。

そして、おそらく全社的にデータ活用の意識が生まれれば、プロダクト開発に限らず営業とかCSとかバックオフィス側の仕事にも活きることがあるのではないかなと考えています。データを使うことで楽になる部分があるのであれば、その整備も会社として行えたらいいなと思いますね。

上田:ありがとうございます。これからの課題について伺えたので、このあたりを整えていくことでさらにいいアウトカムを出していけるような気がしますね。こういった話、中川さん(CEO)とか聞いているかな……?

赤池:ぜひ、聞いてもらえていたらうれしいですね。


子育てを経験して感じた、仕事選びにおける「社会的な意義」の重要性

上田:データサイエンティストの人たちから見るカケハシって、どういう印象があるんでしょう。赤池さんがどうしてカケハシを選んだのかって話にも通じる点なのかもしれませんが。赤池さんから見る、データサイエンティスト界隈のカケハシってどうですか?

赤池:そうですね。多くのデータサイエンティストに知られている、広く届いている会社とはまだ言えないような感覚がありますね。僕がカケハシに入社した決め手って、結局「人が魅力的だった」っていう点に尽きるんですよ。面接でお会いした数少ない人ではありますが、その人たちがとても魅力的で、自分もここで働きたいと思えたっていう。

あとは、良くも悪くも捉えることはできますが、未開拓だったというのも興味を抱いたポイントです。たとえば、プロダクトの分析はもちろん、先ほども話したような営業、CS、バックオフィスの分析など、やりたいと思えばデータを活用できる可能性がたくさんあるなと思ったんですよね。

もちろん、データを整理するっていう大変な作業がつきものなんですが、分析を通じて価値貢献ができるってすごくいいなと思って。宝が埋まっているような感覚があったんです。

上田:なるほど。カケハシがこれから本格的に注力しようとしている医療業界に対する大きな価値貢献っていうところは、エキサイティングなポイントとして映るんですかね。それよりも、仕事の幅や範囲みたいなほうにわくわくするものなんでしょうか?

赤池:人によるのかなって気はするんですけれど、基本的にはそのいずれもってことなんだと思います。僕の場合、以前勤めていたAIベンダーで一つひとつの分析の、その先の顧客側のアクションに深く入り込めないことに対する寂しさを感じていたので、分析結果がビジネスに活きる今の環境はすごく有意義ですし。

ベンダーだとどうしても分析結果をパッケージとして企業に提供しておしまいになってしまう。僕は、そのデータが社会にどう貢献するのか、誰かをハッピーにできるのか、そういったことに興味を持っていたので、カケハシが魅力的に映りました。

上田:そっか、そっか。人が決め手になったとは先ほどおっしゃってくださいましたが、分析データを活かせる環境にも魅力を感じられたってことなんですね。

赤池:そうですね。自社で分析している会社にいきたいっていう気持ちも強かったです。自社にプロダクトやサービスがあって、分析業務との距離が近いところに身を投じたい。加えて、人が魅力的で、かつ自由にのびのび働けるって最高だなと思って、カケハシに入ったっていう感じですね。

上田:ちょっと意地悪なことを聞いちゃうんですけれど、自社で分析するって、こういうトレンドのさなかですし、カケハシに限らずめちゃくちゃあるんじゃないかと思うんです。転職活動をするにあたってはいろいろな会社からオファーがあったのではと推察しますが、なんでカケハシだったんでしょう?

赤池:そんなに追い詰めないでください(笑)。そうですね、なんでカケハシだったのか……ベタな話かもしれないですけれど、2年前って今よりも子どもがまだ小さくて、検診に連れていったり、体調を崩して病院にかかるみたいなことが多かったんです。

そういう経験を経て、自分にとって医療が密接に関わることに気づいたし、カケハシでなら社会的に意味のある仕事ができるのかなと思ったんですよね。

「社会貢献」って言ってしまうと少し軽く聞こえそうですが、人生をかけてやる意味のあることをしたい、そうしないと納得して働くことなんてできないよなって考えて。そういう背景があったので、医療に関わるっていうことが自分のなかでしっくりきたんですよね。

上田:そうですよね。儲かればいいっていうわけじゃなくて、本当に価値のあることをやりたいっていう気持ちが強かったのかな。子どもが生まれたっていうのは赤池さんのなかで大きい変化だったんですかね。

赤池:はい、だいぶ生活が変わりますからね。

上田:価値観も変わりますよね。「この子が大きくなったときに意味のあるようなことをしておきたい」って気持ちとか、僕にもあるので。

赤池:少なくとも鼻で笑われない仕事をしようかなと思って。

上田:カケハシが言っていることが実現すれば、子どもたちが大人になったときの社会は今よりも良くなっているのかなと思いますしね。そういうのに寄与できるような仕事をしたいっていうのは、僕の入社した理由の一つだし、同じように考えている人はカケハシに多い印象です。

医療というカテゴリー、ドメイン、カケハシが取り組もうとしていることに対して、自分自身の人生の時間を捧げるに足るなにかを感じたっていうのが、赤池さんにとっても決め手ではあったんですね。


職種やポジションの垣根が少ないカケハシの組織

上田:カケハシへの入社の決め手には人の魅力があったとのことでしたが、どういう話をして、どんな言葉に心を動かされて……みたいなのがあったんですか?

赤池:う〜ん、最近記憶力が弱くて、この言葉がっていうのは正直覚えていないんですけれど(笑)。佇まいとか喋った感じとかが好きだったんですよね。肩肘張っていない雰囲気ではありながらも、クレバーさっていうのが伝わってきて。

上田:はいはい、なるほど。たとえば、どんな方と面接されたんでしょうか?

赤池:新田さん、保坂さん、山田優花さん、先日記事が公開された木村彰宏さん、あと山本Jさん、海老原さんです。

上田:みなさん〜褒められてますよ! ちゃんとこのラジオ聞いてくださいね!(笑)

赤池:(笑)。いくつか会社を経験していると、人として合う人と働けるかどうかって大切なポイントだなって思うんですよね。その直感を今回は信じてみようって。

上田:これまでの反省を踏まえて、こういう人とは一緒に働かないようにしようっていう気持ちもあったんですか?

赤池:まあ、雰囲気が合わなさそうだなっていう会社にはそもそもエントリーしないんですけれど、全体的に勢いで乗り越えようみたいなカルチャーを感じるところは避けていましたかね。とはいいながら、僕自身は勢いでなんとかするときがあるんですけれど(笑)。

上田:なるほど、僕もそういう違和感を持たれないように気をつけようと思いました(笑)。カケハシの特徴や「ここ変だよね」みたいなポイントってあったりしますか?

赤池:そうですね、僕はキャリアの多くをデータ分析組織のなかで過ごしているので、カケハシのようないろいろな職種の人とまぜこぜで働く環境が新鮮です。組織的にも職種的にもフラットなので働きやすいですし。意見も出しやすいし、刺さる意見であれば周りも聞いてくれるので、すごくいいなと思っていますね。

上田:上司と部下みたいな、垣根があんまり感じられないっていうのはありますよね。

赤池:まったく存在しないわけではないんですけれど、だいぶ薄いっていうのがいいなと思っています。ガチガチに階層構造のある組織だと、なかなか意見も言いづらいじゃないですか。その点、すごくコミュニケーションが取りやすくてありがたいです。

僕の場合、エンジニアリングのスキルが足りないって思うことがあるんですけれど、そういうときも身近なエンジニアの方々に話を聞くことができるし、レビューで指摘をいただくこともできて。「こんなやり方があるのか!」ってすごく刺激を受けます。そういう話から横のつながりも生まれました。

開発組織をあんまり経験していない僕がいうのも変な話ですが、スクラムで動いたことがこれまでなかったんですよ。だから、チームとしてやるべきことを取捨選択しながら、人員的に必要なリソースを確保して動いてっていうスタイルは無駄がなくていいなと思っています。

これまでの環境とカケハシの環境はまったく違うけれど、とても居心地がいいなと思っていて、ネガティブな要素をあまり感じていないんですよね。

上田:え、大丈夫ですか? 忖度なしで話していただいていいですよ?(笑)

赤池:(笑)。そうですね……なんだろうな……。データサイエンティストとしてデータ分析に特化して働いていたのがこれまでだったんですが、最近は幅広く動かせてもらう機会も多くて、最近あんまりデータ分析をしていないなっていう話がありますけれど……あえて挙げるとしたらそのくらいでしょうか……。

上田:スタートアップに共通している課題ではありそうですよね。リソースが足りないなかで、自分としてどう動いていくのか、工夫していくのかという点は、僕もたくさん考えているし、まだまだ答えが見つからないなと思うこともあります。

赤池:そうなんですよね。やっぱり僕だけじゃないんだ……!

上田:ありますよ〜。たぶん多くの人がそうなんじゃないかな。いろいろな方にジョインしていただいて、組織力が上がって自分の役割が固定化されてみたいな組織編成の流れはきっとある。

それでも、やっぱりバリューにある「変幻自在」を体現できるよう、一つの役割に固定せずお客様への価値や、周囲への価値貢献に対して、役割を越えてでも動くことにポジティブでありたい。カケハシ全体のカルチャーとして、そういう状態をポジティブに受け止めていける姿勢はもっておきたいですしね。

賛否両論あるのだと思いますけれど、個人的にはそういう雰囲気のカケハシって素晴らしいなと思います。なんだか、無理やりネガティブな要素を言わせてしまったみたいですみません……!

赤池:いえいえ、じっくり頑張って掘り返してやっとこれくらいの話しかできないんですが……。

上田:とりあえず「もっと分析がしたいんだ! 俺に分析のボール持ってこい!」という発言をいただけたので、次の話題に進みましょうね。


データの道に進むことを後押ししてくれた“運命の一冊”をご紹介!

上田:さて、なんやかんやで、めちゃくちゃおしゃべりしちゃってますね僕たち。

啓祐:はい、毎回毎回あっという間に時間が過ぎちゃいますよね。

上田:じゃあそろそろ締めのほうに向かっていきたいなと思っているんですが……これだけは最後に聞いておきたいという話として「おすすめの本」をご紹介していただけたらと思っています。前回、木村さんにも伺っているんですが、赤池さんの基礎をつくってくれたような、下積み時代の本を教えていただきたいなと。

赤池:『Handbook on Impact Evaluation』という本をおすすめしたいなと思います。全編英語の本なんですけれど。

上田:めちゃくちゃレベル高いじゃないですか……!

赤池:えっと、頑張って読めばなんとか……(笑)。僕、大学院のときに開発経済学の教授のもとで研究をしていて、そのときの教科書として選定されていた本なんです。この本では、統計的因果推論という分野について、あらゆる手法を章立てしてまとめているんですが、僕はこの本と出会ったことで「データ分析ってすごいな」と思うようになったんですよね。

なので、この本と出会っていなかったら、今のようにデータサイエンティストとしてのキャリアを歩んでいたのかどうかも怪しいくらい。今回の収録にあたっていろいろと本を見返したんですが、こういうときにご紹介したいのはこれかなと思い持ってきました。

上田:なるほど。いわゆる手法と呼ばれるものが教科書的に載っている本なのかと想像はするんですが、赤池さんの心を動かしたポイントや話があれば、もう少し教えていただけますか?

赤池:そうですね。この本は大学院に進学して最初の頃に使った教科書だったんですが、そのときの僕って教員養成系の教育学部から移ったばかりで統計学の基本もなにもよくわかっていなかったんです。そのうえエンジニアリングスキルも皆無で。Excelでのセルとセルの足し算すらできなくて、入力されたセルを見ながら電卓叩いているような学生で、指導教員が慌てていました。

そのときの僕がこの本を読むことになるんですが、データを分析するといったいなにができるのか。そのあらゆる可能性を知ることになったんです。たとえば、統計的に因果関係の効果を分析するっていう手法が載っていたんですが、「因果関係がある」とはどういう状態なのか、その因果関係をどう証明するのか、そういう理屈を立てる方法をたくさん学べて。

効果を比較するだけではなく、効果を見たいグループとそうでないグループとを分けて比較する方法とか、そういう具体的な例から、データが持っている可能性をすごく感じて、わくわくしたんですよね。

これを聞いてくださっている方が面白いと感じてくださるかどうかはわからないんですが、ネットでフリーでダウンロードもできるので読んでみてほしいです。少しは楽しさが伝わるかもしれません。

上田:ただデータをコネコネと分析するだけではなくて、なんのために分析するのか、分析してどうするのかみたいな、赤池さん自身が先ほどおっしゃっていた「分析のための分析」を覆す内容ってことなんですかね。今の仕事のマインドにもつながるような話なのかなと思って聞いていたんですけれど。

赤池:あ〜そうか、たしかにそうですね。直結させて考えたことはなかったですが、案外つながっているのかもしれません。因果推論の話もやっぱり設計がすごく大切なんですよ。なにが知りたくて、どうする必要があるのかってところがきちんと整理されていないと分析が進めにくいので。

そういった意味では、効果を出すためのプランニングをして、アプローチ方法を考える流れは、この本から学んだ部分があるのかもしれないです。

上田:赤池さん自身にとっては、その考え方自体から面白さを感じたというか、芽が開いた感覚だったのかもしれないですね。

赤池:そうですね。もっと知りたいと思ったという感想が素直なところでしょうか。

上田:なるほどな〜。統計的因果推論っていう概念、専門外の人間からするとまだまだわからない部分も多いんですが、その言葉をキーワードに読んでみると少しだけわかるかもしれないですよね。

赤池:そうですね。たとえば、よく「相関」と「因果」って仕事の会話で生まれるじゃないですか。「これは因果関係じゃなくて相関関係ね」みたいなやつ。その因果と相関の区別の方法が載っていたりもします。

上田:なるほど〜。いや、ハードルは高いけれど、興味はすっごく湧いてます。

赤池:PDFでダウンロードもできるので、日本語に変換すれば読みやすくなるとは思いますよ。

上田:そういえば、啓祐さんはもうさっそくダウンロードして読んだとのことでしたが……?

啓祐:そうですね、収録するにあたって事前に教えていただいたので、たしかにダウンロードはしました。なんなら序文も読みました。

赤池:本当ですか、すごい!

啓祐:で、めちゃくちゃ英語なんで、本当に時間がかかるなっていう印象を抱いています。ただ、メソットが書いてある様子は見えたので、ためになりそうだなっていう雰囲気は感じ取りました。僕がもっと英語をスラスラ読める人間なら……と学生時代を振り返って後悔しているところです。ちょっとずつ読み進めていこうと思っています。

ただ、データを取り扱ううえで困ったことがあったときに探しにいく本としての使い勝手が良さそうですよねこれ。「Handbook 〜」っていう名前ですし。僕もデザインの本なら英語でも読めるのに、データの本になった途端なかなか読めないの不思議だなあ。

上田:こういう内容の本を、赤池さんのような方々から、僕みたいな素人に噛み砕いて話してもらえる機会があったらいいなって思いました。

赤池:たしかに、少しだけでも話してみれば興味が湧くかもしれないですよね。

上田:そうそう、先生を目指していたっていう背景もありますし、社内向けに勉強会とかしてほしいな……。

赤池:それはちょっといいですね、やりたいな。

上田:というところで、そろそろお時間がきてしまいましたので締めに入りたいと思います。赤池さん、最初は緊張していますとおっしゃっていましたが、いかがでしたか? かなりいろいろなことをお話いただいたかなと思いますが。

赤池:なんだか喋っている間にだんだんと緊張がほぐれました。ただ、なんか話が長いなっていうのは自分の反省としてありますね。

上田:いやいや、それは毎回僕が思っていることなんですよ(笑)。でも楽しんで話していただけたのならよかったです。

啓祐:そうですね。今回、赤池さんとお話できたことで、データについてわからないことがあれば気軽に伺ってみようかなっていう気持ちになれました。迷惑かもしれないんですけれど……。

赤池:まったく迷惑なんかじゃないので、ぜひお願いします。

上田:今回はデータサイエンティストっていう大きなくくりから話を展開しましたが、赤池さん自身の仕事がどういったもので、それを通じてプロダクトに対してどんなインパクトを出しているのか、プロダクトの今後の成長はどういったものなのか。そういったところの解像度が上がってすごく勉強になりました。

日頃はプロダクトに向き合っている時間が長いかなとは思うんですが、ぜひ他チームとの交流や勉強会なども仕掛けていただきたいですし、そのお手伝いなんかもこれからもご一緒させてもらえたらうれしいです。引き続きよろしくお願いします!

赤池:こちらこそ、よろしくお願いします。

上田:はい、ということで今回はデータサイエンティストの赤池さんに来ていただきました。赤池さん、ありがとうございました!

赤池:ありがとうございました!

上田:それではみなさん、また次回お会いしましょう。さようなら〜!

啓祐:さようなら!


みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!

カケハシでは公式Facebookで最新情報を更新していますので、ぜひチェックしてみてください!