プロローグ
僕はプログラムは書けないしウェブページを作ることもできないので、その意味ではIT分野の「はしくれ」に位置する人です。しかし、恐らくですがデータベースの捉え方だけはちょっと尖っています。社会全体を捉えると、データサイエンティストはIT分野の「はしくれ位置」から意思決定の重要部分へ移ろうしています。そこで、データベースについて書いてみようと思います。
データベースとは座標
例えば1、2、3、4…という数字だけではデータベースとはなり得ません。これが13時の1、14時の2、15時の3、16時の4はデータベースとなります。つまり、座標という言い方をしましたが、それは「1」「2」「3」「4」の位置をきめるために、もう1つ以上の情報と組み合わされた状態をいいます。座標というと点を意味しますが、データベースの座標は「範囲」ということもあります。例えば源泉税を納税する時に使われる税額表は「範囲」と「点」をつなぎ合わせたデータベースと言えます。
もっと砕けたものを取り出しますと、日記はデータベースです。何月何日にしたことや、感じたことや、考えたことが記載されているからです。ブログもデータベースとなりえます。例えば、4月22日に書いた「地方都市の活性化について思う」はデータベースです。
さて、人について考えてみましょう。個人のことです。個人の名前だけではデータベースではありません。住所、電話番号、マイナンバー、所属している組織のいずれか、または全てと結びつくことでデータベースとなります。これって個人情報のことを言ってますよね。そうなんです。個人情報とはデータベース化されるものを言っているのです。よくスパイ映画で使われるスパイ名のリストはデータベースなのか?組織と紐づけされているのでデータベースです。ちょっとゾクゾクする話ですねヾ(。>﹏<。)ノ゙✧*。
もう一つの基準:整然としてること
データベースは整然としていることが要件です。例えば「並べ替えることができる」というのは分かりやすいと思います。整然としているところからしか分析や活用の道は開けません。ということは、ある程度整然としやすい形状であることが大事です。一番分かりやすいのはコンピュータに入力してしまうことですが、何もコンピュータだけがデータベースを扱えるわけではありません。ただ単に適してるだけで、例えばカードに書くと後から整然と整理しやすくなるので立派なデータベースになります。
ビッグデータももちろんデータベース
例えば携帯電話の使用状況や高速道路のインターチェンジの出入状況、コンビニエンスストアのレジの稼働状況も、必ず2つ以上の座標で導かれるものの集合体ですからビッグデータです。でも、本当に大事なのはこれからです。
データベースを分析したり活かすのは別の問題
せっかくのデータベースですが、分析し活かさなければ宝の持ち腐れです。それには目的を明確にすることが大事で、言ってしまえば「目的」を思いつくことが成否の鍵になっていると言えます。
その昔、大手メガネ販売チェーン店の話が面白いので取り上げます。その会社の社長さん、会議でこう言ったそうです。
「当社の顧客は200万人もいて、君らはこの200万人にメガネしか売り切らんのか?」と。
この言葉がデータベースの分析と活かし方の難しさを端的に表していると思います。この話は30年ぐらい前の話ですが、その眼鏡チェーン店は…いまだにメガネしか売っていませんww
どのくらいのデータが集まると分析し活用可能になるのか
結論から言うと100「近く」です。ただし、ちょっと仕掛けがありまして要素としては30×3以上が必要だと思います。30人×3要素以上で90になりますから、100に近づくわけです。さらに4要素にすれば120です。しかし30人を減らしていって要素を増やすとどうなるのか?例えば2人に50項目のアンケートを取ってみたとします。これって意味があるでしょうか??どう考えてもないですよね(^^;つまり30人ぐらいはないと、逆に分析して活かせるデータベースにはならないのではないかと思います。50人×2要素はデータとして活かせそうですし。
それから、データベースを収集する時に気をつけなければならないのは、分析して活かす目的が極大化していくと、自分の思っている方向に活かせるようなデータを集めてしまいがちになります。分かりやすく書きますと、会社全体をAの方向に持っていきたいと思ってデータ分析を開始する時に、意図的にAに有利なデータを分析してしまうことがあるということです。本当はプランBが正解かもしれませんからね。ということは、分析して活かす人にはデータに対して真摯に向き合う姿勢が必要ということです。
エピローグ
突然データベースの話を持ち出してみました。僕の場合、財務経理屋ですので日々のお金の動きはまさにデータベースです。これをどう分析し活かすのかで会社の明暗を分けることになりますので、こういうことは重要だなと思っています。そして、その目線を仕事の引き継ぎの中に入れてます。「思考パターン」という言葉でもいいですけどね。ただ、データベースというと経理だけでなく、マーケティングにも、物流、機械設計にも活かせる要素で、この技術は近年重要性が増してきているように思います。ということで、思いついて書いてみました。
コメント