決定版は、いいかげんみなさん意識しましょうと意訳してください。
TL;DR
- 「0」「1」はデータです
- 「晴れ」「雨」は情報・・・
- 「晴れ」「雨」は データ です。
はぁ?
システムには設計がつきものですが、設計するときに「情報」と「データ」を区別して設計仕切れていない人が多いですね。
当たり前のように無意識にこなしている人もいるので、かえって問題が見えづらくなっているきらいがありますね。解説しようとしているサイトもあるんですが、完全に他に必要な情報量の中に埋もれている感はあります。
5分で絶対に分かる(18):5分で絶対に分かるビジネス・インテリジェンス (1/6) - ITmedia エンタープライズ
「データ」と「情報」の違いとは? | We Love Kyushu
最終的に出来上がってくるものはある程度同じにはなるんでしょうが、ちゃんと区別しておかないと、運用中や改善・更改でのコミュニケーションにかなり問題が出てきます。
これは、具体的例をベースに追いかけたほうが良さそうですね。
例題
ある製品は法律上で規格が決まっています。規格の種類は「A」「B」「AB」の三種類があります。 製品マスターデータには「規格区分」というフィールドをもたせます。
このとき、「規格区分」はどのような形式、桁にするでしょうか。
- 文字列型、数値型、列挙型・・・
- 1桁、2桁、99桁・・・
いろいろ状況によって考えられると思いますが、概ね皆さん次のようなことを考慮して検討すると思います。
この規格は今後どのくらい変わる可能性があるだろうか?
法律とはいえ、1年、2年もすれば変動する可能性があります。
「A」「B」「AB」ときているので、次にくるのは「C」?「AB2」?
まぁそうなったとしても、10桁もあれば大丈夫でしょう。
さぁ、みなさん設計して・・・
開発して・・・
テストして・・・
仕様変更があって・・・
移行あたりの工程でトラブって・・・
・・・
さぁ、運用開始です!(一部支店でのみの運用・・・
そして時は来た
翌年、法律の改正により、次のように規格変更が発表されました。
「A」⇨「スーパー山田太郎式」
「B」⇨「佐藤鈴木型工場制手工業的ノスタルジック式」
「AB」⇨「寿限無寿限無五劫の擦り切れかいじゃりすいぎょのすいぎょうまつうんぎょうまつふうらいまつぽすぽぴぺろぺろさま式」
さぁ、ここで末路を見てみましょう。
「A」「B」「AB」の文字列データを格納してたシステム
- 10桁とかそんくらい取ってたシステム
- とりあえずVARCHARマックスとか取ってたシステム
数値型とか区分決めて格納してたシステム
みなさん、なんとかその場を乗り切ったようです。
時間とお金があれば、大体解決しますので。。。
本題
さて、ここで問題です。
「A」「B」「AB」、これらは 情報 だったんでしょうか? データ だったんでしょうか。
正解は「データ」です。
では、この場合の 情報 は何か?それは、「A」「B」「AB」それそれの名称をつけられた 現実の事象 です。今回の例では製品の規格でしたので、製品の形状・材質などそれ自体のことを指します。
次の図をみてください。
ここでの左に並んでいる3つの図形が「情報」です。 その右に並んでいる「A」「B」「AB」はそれぞれの図形に対応していますが、その文字自体に意味はなく、真に情報足りえるのは真価たる左側の図形です。
では、規格を変更してみましょう。
こうなると、右側の名称は、左側の図形を表す”ただのラベル”と化します。
これが「データ」たる所以です。
設計をする際には、左側の図形について考えていきましょう。
そうすれば、「この規格は今後どのくらい変わる可能性があるだろうか?」ということを真に情報に基づいて検討することができます。
ここまでシステムの対象となる情報のことを考える必要があるので、そりゃ外注SIだけじゃ無理で情シスしっかりせんといかんよね、と思うのですが、それはまた別の機会に・・・
屁理屈言うな!
まさに、一般的には浸透しない突き詰め方だと思います。
ですので、みなさん世間でうまくやっていくには、この”ただのラベル”を表す段階の「データ」までは、”広義の「情報」” であるとして会話をしたほうが、大体うまくいきます。
ただ、最終的な左側の図形までを意識して設計する場合と、そうでない場合では、きっとお客さんと仕様を詰めるときの”詰め加減”には大きく差が出てくると思います。
おわり
みなさんも”IT”業界、すなわち”情報技術”に携わるものとして、しっかりと情報とデータの違いについて 考え 、ライバルに差をつけましょう。
(終わり文句が最近大体同じ・・・)