セミナーレポート/SHIONOGIにおける次世代データマネジメント

セミナーレポート/SHIONOGIにおける次世代データマネジメント

「データサイエンスとのコラボが生み出す新しい価値 −やりたいが繋がる場所−」をテーマとするオンラインイベント「SHIONOGI DATA SCIENCE FES 2023」が2023年3月1日に開催されました。本記事では、塩野義製薬 DX推進本部 データサイエンス部 雑賀 恵美氏によるセミナー「SHIONOGIにおける次世代データマネジメント」より、塩野義製薬におけるセントラルデータマネジメントの取り組みについてレポートします。

塩野義製薬のセントラルデータマネジメントとは

塩野義製薬のデータサイエンス部では、社内のさまざまな領域で発生するデータを集め、管理し、データの資産価値を高めるために「Central Data Management(CDM)」の取り組みを行っています。

雑賀氏は、CDMには大きく分けて2つの役割があると言います。1つ目は、業務システム間のデータ連携において収集配信のデータハブとなる役割、2つ目は、分析や解析をするためにデータを活用しやすい形で準備しておくデータウェアハウスとしての役割です。

セミナーでは、データウェアハウスのマネジメントについてフォーカスし、2つの重要な考え方を紹介しました。同社が考えるデータマネジメントのあり方として重要なポイントは、まずニーズを先取りし能動的であること。そして中央集権型を脱却し、分散型のデータコミュニティを形成することだと雑賀氏は話します。

ポイント1 能動的データマネジメントの重要性

データを収集する際、通常はビジネスサイドの業務目的が起点となりデータ登録が始まることが多いと思います。しかし、ビジネスサイドだけではデータの二次利用の有用性に気づいていない、あるいは気づけないこともあります。

そのため、データを集め、活用しやすい形で用意するCDMが重要となります。一次目的にとどまらず、別の視点を取り入れ、他のデータと掛け合わせるという活用方法は、CDMのデータを俯瞰的に見られるからこそできることです。雑賀氏は、「データを収集した先の活用シーンと要件を提案することも、データマネジメントの役割」だと話します。

従来のデータマネジャーが注力する仕事は、「データを収集し、扱いやすい形に変えて必要なときに分析者に提供すること」まででした。しかし、それだけでは潜在的なデータの価値を十分に引き出しているとは言えません。同社では、データマネジャーが自らニーズをキャッチアップし企画提案を行い、データ活用者が知見を得てサービスへ転換するまでの効率アップに貢献する存在にシフトしていくべきだと考えています。

例えば、データ活用者の課題が「最新の正確なデータを入手したい」であれば、データが集まる、正しく使える仕掛けを作ること。「仮説を立証するには、どのデータを使用すれば良いか」であれば、データニーズを予測し目的にマッチしたデータを選定すること。「次はどのようなテーマの分析をすれば良いか」であれば、ビジネスサイドにデータから得られる仮説を提案する。そういったデータマネジメントの役割が考えられます。

雑賀氏は、「データマネジメントにはデータ活用者、さらにはビジネスサイドに一歩踏み込むことが求められている」と現状を明らかにしました。

ポイント2 分散型データコミュニティの形成

データマネジャーは最新の正確なデータを集め、それをタイムリーに正しく利用できる仕掛けを作らなければいけません。その仕掛け作りの一つとして、同社では、分散型データコミュニティを形成しています。

従来の中央集権型データコミュニティでは、データマネジャーのみがデータ管理者としてデータウェアハウスを運営するため、システム構築の際にデータ活用者が参加しようとすると、それだけで時間がかかってしまうことがありました。また、中央管理のデータマネジャーは、データハブとして、システム構築や管理に必要な視点は比較的取り入れやすいですが、さらに分析者の視点も取り入れる必要があるでしょう。

データそのものの情報も、データ活用者の視点で管理することが重要です。そのためには、データ活用者自身にデータマネジメントに参加してもらおうというのが分散型データコミュニティの考え方です。

データ活用者がデータマネジメントに参加することで解決を図る
2023.3.1 塩野義製薬(株)「SHIONOGI DATA SCIENCE FES 2023」講演資料より抜粋


まず、データ活用者自身がデータ管理者となり、必要なデータをデータウェアハウス(DWH)に持ち込みます。同時に、データ活用に役立つメタデータを取捨選択し、他の参加者にも共有します。これは、いくつもの部署で知らず知らずのうちに同じようなデータを準備したり調査したりといった無駄をなくすことにもつながります。

分散型データコミュニティにおけるCDMの役割

分散型データコミュニティでは、従来のデータ管理を担っていたデータマネジャーは、データウェアハウスの運営管理者として、コミュニティの場を提供し、自立性を引き出すことに注力します。

雑賀氏は、自立性を引き出すコミュニティにおけるルール作りやその周知徹底など、運営管理を行うことがデータマネジメントの活動の一つだとし、さらに「分散型データコミュニティを運営管理することで、企画提案につながるアイデアを得られ、また逆に企画提案を意識して運営管理を行えるという相互作用がある」とも述べました。

データが価値を得るまで
2023.3.1 塩野義製薬(株)「SHIONOGI DATA SCIENCE FES 2023」講演資料より抜粋

継続的にデータベースの価値を高めていく

さらに同社では、日々データの検索性の向上に取り組んでおり、その一環として独自のデータカタログシステムを開発しています。また、実際にデータを活用する際の業務イメージも紹介されました。

データ活用者は、必ず目的を明確にして利用申請を行います。そして分析や解析の成果を報告することも必須としています。一方のデータ管理者はその利用状況や成果から新たに必要とされているデータやメタデータ情報を把握し、データウェアハウスやデータカタログに追加していきます。そうすることで、探しやすく使いやすいデータベースへと成長させています。

雑賀氏は、「データガバナンス体制の明確化やデータリテラシー教育を行った上で、利用目的と成果を透明化し、データ活用にとどまらず、成果も二次利用することでデータサイエンスの生産性向上を目指しています」と締めくくりました。