入社して6ヶ月でデータクオリティチームを立ち上げた話

https://cdn-ak.f.st-hatena.com/images/fotolife/e/estie/20210328/20210328044551.png

こんにちは。estie編集部のtoyoです!

今回のインタビューは、estieのプロダクトには欠かせないデータクオリティーチームのPdM石野さんです。石野さんはestieが持つデータのクオリティを維持し、高めていくだけでなく、全社的にデータへの関心や理解度を深めるための取り組みをしています。PdMとしてのチームの立ち上げ、現在取り組んでいること、データエンジニアとしてのやりがいについてもお聞きしました。

石野さんの他の記事はこちら。
inside.estie.co.jp

データクオリティチーム発足の経緯を教えてください。

石野:入社当初、私はデータチームの一員としてestieのデータベースにデータを格納するパイプライン構築や、収集したデータを使った「推定成約賃料のプロジェクト」に携わっていました。

実は、オフィス賃貸は住宅賃貸と違って、賃料情報が殆ど世に公開されていないことが大きな特徴です。私たちは、estieのサービス上でビル情報を入力すると、集めたデータを元に「今いくらで借りられるか、今いくらで貸せるか」を弾き出す成約賃料の予測モデルを作っています。この開発を進めていく中で、データの質がプロダクトに与える影響が非常に大きいことをひしひしと感じていました。

データの量や質をより向上することができれば、ユーザに届ける価値をもっと高めることができます。しかし、当時はデータパイプラインを作るチームが細かいデータの修正も兼任でやっていた形で、それを専任でやるチームはなかったんですよね。現在は、おかげさまでユーザ数も徐々に伸びてきていて、ユーザに届くデータをより価値のある状態にしたいと思っています。そのような背景もあり、データクオリティ専門のチームを2021年2月に立ち上げました。

実際にチームを立ち上げてみて、どんな取り組みをしていますか。

石野:いわゆるデータの拡充ですね。まずは、今estieが持っていないデータを増やす取り組みをしています。闇雲にデータを集めても効果は少ないので、ユーザにとってインパクトの大きいデータに優先度をつけて集める取り組みをしています。

実際に、自分達の集めてきたデータがどれくらい見られているのか、どういうところに注目度が高いのかというユーザログの分析もやっています。それによって、現状estieの出しているデータに対して、もっと改善できる余地はないかなど優先度の指標として可視化しています。また、データパイプラインの自動化によって収集したデータをある程度人の目で確認することで、パイプラインに対してのフィードバックを行い、より良い仕組みにする努力をしています。

f:id:estie:20210326140856p:plain
データ管理ツール 通称Medamayaki

データ管理ツールのわかりやすい説明はぴーまん君の記事にまとまっています。
inside.estie.co.jp

他には、今までデータのメンテナンスはデータチームしかできなかったのですが、チーム以外の社員でもメンテナンスをできる管理ツール作ることに取り組んでいます。また、過去から現在までに集めてきたデータの量を可視化できるようにして、データの拡充がどれくらい進んでいるのかを常に注視できるようにもしています。全社でデータをより良くしていくという仕組みを作りたいですね。

f:id:estie:20210326140927p:plain
データ拡充の進捗を確認できるダッシュボード

全社的にデータをより良くしていこうとする中で、工夫されている点などはありますか。

石野:社内でデータを扱える人を増やしたいと思っていて、SQLのテーブルの構造を他の人に共有するようにしています。というのも、データをより良くしていくためには、エンジニアがデータを見るのは当たり前として、ビジネスサイドからもフィードバックし合う事が必要です。なので、営業担当もデータにアクセスしやすいような環境づくりは心がけています。
例えば、毎回SQLを書くのは時間がもったいないですし大変なので、よくアクセスするデータに関してはダッシュボードを作り、すぐに現状を確認できるようにしています。

この取り組みの中で見えてきた課題はありますか。

石野:データ拡充の優先度付けが難しいですね。プロダクトの品質を上げるためには、より効果的なところを改善していかないと、すごくリソースも使うし効果も期待できません。何も考えずデータを増やすことは簡単ですが、それがユーザにとって全然興味のないデータだったら、あまり意味はありません。ユーザの注目度が高いのはどこなのかを優先的にあぶり出すことが重要ですし、その部分の見極めは難しいですね。

f:id:estie:20210326140844p:plain
ユーザーが現在どのようなビルに注目しているかを可視化するダッシュボード

データエンジニアとして取り組む中でのやりがいはありますか。

データの品質改善は非常に泥臭く、一つ一つのデータをつぶさに確認していく作業が必要です。ふと、なぜこの仕事をやっているのかなと考えてみたら、「誰も知らないことに一番初めに知れること」が楽しいんだなと気づいたんです。それは僕のbeat makeの趣味にも繋がっているのですが、既存のあまり有名じゃない曲などを探してきて、その曲を自分でサンプリングし原曲とは違う形にして自分のものにしていく遊びをするのですが、それがすごい楽しくて。

データも同じように、活用できなかったら価値はないのですが、インサイトを見つけるためにひたすらデータを掘って加工して、意味を持たせていく。特に、不動産データはかなりデータとして扱いづらいのですが、そこが自分的にはすごく面白いと感じている所ですね。

最後に、今後の展望を教えてください。

石野:データクオリティチームの立ち上げ以前は、データチームがどのようにしてデータを作成し、改善しているか見えづらくなっていました。チーム内で業務が閉じていた感覚があり、ビジネスサイドやユーザ側の客観的視点の把握ができていなかった部分もありました。
しかし、今はデータクオリティチームの立ち上げによって、自分達が扱っているデータベースに(必要な権限を整理したうえで)社員全員がアクセスできる環境を整えることができています。引き続き改善点を共有しあい、より使いやすく洗練されたデータにしていきたいですね。

おわりに

estieではともにプロダクトを作り上げる仲間を募集しています!
少しでも興味をもっていただけたら是非ご連絡ください。