Photo By Shutterstock
伊藤僑
Free-lance Writer / Editor
IT、ビジネス、ライフスタイル、ガジェット関連を中心に執筆。現代用語辞典imidasでは2000年版より情報セキュリティを担当する。SE/30からのMacユーザー。著書に「ビジネスマンの今さら聞けないネットセキュリティ〜パソコンで失敗しないための39の鉄則〜」(ダイヤモンド社)などがある。
セキュリティリスクとなるダークデータとは?
未整理のまま保存されているデータが、セキュリティ上の大きな懸念材料になってきている。
IT化の進展により、日々の企業活動は膨大なデータを生み出している。それら巨大なデータの集合は「ビッグデータ」と呼ばれ、活用次第ではビジネスを成功に導く鍵にもなると期待されているが、未整理のまま保存されていて価値が不明とされるデータも少なくない。
この、有効活用されることなく保存されているデータは「ダークデータ」と呼ばれている。
ビッグデータには、ダークデータ以外に、古い、あるいは重複していて価値のない「ROT(Redundant Obsolete Trivial)データ」と、ビジネスに有効活用可能な「クリーンデータ」がある。
社内データのうち半分以上がダークデータ
今年5月、Splunk Service Japanはダークデータに関する調査結果を発表した。調査期間は2018年10月〜2019年1月で、調査対象となったのは、7カ国(日本、米国、英国、ドイツ、フランス、オーストラリア、中国)の、合計1365人のビジネスマネージャーとITリーダーだったという。
同調査で明らかになったのは、調査対象者による推定を平均すると、社内データの約55%が、把握、または活用されていないダークデータであるということだ。
少し古いが、ビッグデータのうちコンピュータが理解・分析できる「意味ある」データは全体の20%のみで、残りの80%はダークデータに分類されるとする見解(IBM Big Data Analytics Hub:2016年9月)もある。ただし、同データにはROTデータも含まれているようだ。
つまり、社内に蓄積されているデータのうち半分以上がダークデータだというのだ。
なぜ価値が不明な未整理のデータはリスクとなるのか
では、なぜダークデータのように、価値が不明な未整理のデータがセキュリティ上のリスクになるのだろか。
その理由の1つが、データの保存には少なからぬコストがかかることだ。
例えば、信頼性の高いAWSのS3標準ストレージでは、最初の50TB/月が0.023USD/GB。単価は低くても、旺盛な企業活動によって日々データが蓄積されていけば、中規模企業でも年間数百万ドルのコストがかかるといわれる。
ビジネスに有用なクリーンデータだけをきちんと選別して保存できれば、データ保存コストを大幅に低減でき、他のセキュリティ対策へ予算を振り分けることも可能になるのだ。
また、価値が不明な未整理のデータを保有していると、それらのデータが漏洩・流出した際にも対応に苦慮することになる。
漏洩したデータの内容も価値も把握できていないということは、顧客や提携先などへの影響を精査することも困難なので、対応は後手後手にならざるを得ない。顧客や提携先に迷惑がかかってから、そのデータの価値が分かったのでは遅すぎる。
ランサムウェアによってデータを人質にとられた場合にも、肝心のデータの内容・価値が分からなければ、いかに対応すべきかで悩むことになる。
AI技術でダークデータを有用性の高いデータへ
ダークデータなど「どうせ役に立たないのだから放置しておけばいい」と考えがちだが、最近では、ダークデータの価値を見直す動きも出てきている。
飛躍的に進歩しつつあるAI技術などの活用により、ダークデータを解析する「ダークアナリティクス」の可能性に注目が集まっているのだ。
前述のSplunk Service Japanの調査でも、ビジネス部門、IT部門の意志決定者の71%が、データ分析プロセスにおけるAI活用が有効だと考えていることが判明している。
すでにAppleが、AI推論エンジンの適用によって、ダークデータを、構造化された、より有用性の高いデータへと変換する技術を持つLattice Dataを2017年に買収していることからも、ダークアナリティクスの可能性をうかがい知ることができるだろう。
個人も未整理のまま保存しているデータに注意
未整理のまま保存されているデータに注意が必要なのは、企業ばかりではない。
SNSやWebサービスなどの多様化によって、個人が扱うデータの量も飛躍的に増加しつつある。にもかかわらず、自分のパソコンやスマホに保存されているデータを、きちんと整理し、その内容をすべて把握している人はごく一部だろう。
パソコンやスマホを置き忘れたり盗まれた際に、格納されているデータの内容が分からずに悩むことがないよう、日頃からデータの整理を行っておきたい。もちろん、バックアップすることも大切だ。