設計者の発言

業務システム開発とデータモデリングに関する語り

データよりも「データ様式」が重要だ

 「現代の経営においてデータの重要性が高まっている」といった言い方をよく耳にするようになった。たいていは、ビッグデータ分析とかデータ駆動経営といったバズワードの文脈なのだが、いつも残念な気持ちになる。それらが効果を上げるには「所与のデータ様式がまともであれば」という前提がありながら、それが語られることがまずないからだ。じっさいのところ、まともなデータ様式で運用されている業務システムなど稀で、それらのバズワードの有効性も「嘘ではないが、役立つ状況がほぼない」のが実情である。

 当たり前の話だ。データの矛盾を認める、つまり正規化されていないデータがどんなに大量に存在しても、そこから導かれる分析結果はゴミでしかない。「ゴミからはゴミしか生み出されない(Garbage in, garbage out)」である。最新のデータ分析技術を用いても同じことで、とくにAIにそこらへんを期待するのは無理筋というものだ。ゴミを教師データとして育ったAIはゴミしか吐き出さない。

 何よりも優先されるべきは、データ様式をまともにすることだ。データ分析だろうが、データ指向経営だろうが、事業のDXだろうが、業務システムの刷新だろうが、事業が扱うデータのデータ様式を見直すことをせずには始まりようがない。

 ところが、この優先課題はたいてい無視される。ちょっと気の利いたプロジェクトであればデータ辞書の整備くらいはするし、マイクロサービスあたりを根拠にして部分的なデータ様式の見直しもするだろう。しかしその程度では、事業活動にともなって生み出される膨大なデータは、いつまでたっても矛盾を抱えたままだ。

 事業全体のデータ様式の見直し、すなわち「事業のデータモデリング」がおろそかにされるのはなぜか。ものすごく単純だ。それをやれる技術者がいないからだ。注目されている「データサイエンティスト」も、データモデリングを自分たちの仕事とは考えていないように見える。そんな姿勢が許されていいはずはない。「(データ様式さえまともであれば)どんなデータもあざやかに分析してみせます」なんて専門家が役に立つと思う?

 しかも悪いことにデータモデリングは、文法を理解すれば片手間でやれる作業と思われている節がある。それは「楽譜を読めるようになれば交響曲でも作曲できる」みたいな勘違いだ。なぜそんなことになってしまったのか。文法を解説する書籍はそれなりにあるが、下世話なモデリング事例の情報があまりに少ないゆえではないか。膨大な事例を血肉とする過程がすっぽ抜けている。結果的に、データモデリングの威力や専門性が侮られている。

 「データが大事」と語るのは簡単だ。難しいのは「データ様式が大事」と認識してその見直しをやり抜くこと。デジタル化を旨とする事業改革の果実は、この困難な仕事の向こうにしか待っていない。