数据中心不断地被大量数据们淹没,那么作为数据中心的管理员们,能不能就舍弃一部分不需要的数据呢?
最重要的担心就是怕错过任何可能的有用信息。你公司的营销副总裁很有可能会有朝一日让你提供一份公司过去20年的销售数据。而上面的领导一换,说不定新的数据要求在等着你。
还有一个非常现实的原因,那就是有些公司会申明永久保留数据,尽管这些数据几年、几十年都没人用过。顾能咨询将其称之为“暗数据”,并将其定义为“在正常经营活动中的信息资产组织收集、处理和存储,但一般不能用于其他用途(例如,分析,业务关系和直接货币化)的数据。这类似于物理研究中的暗物质,暗数据是信息资产“宇宙”中的大部分组成结构。因此,组织或公司经常保持暗数据用作参考资料。”
那么,到底你是否可以“减仓“暗数据的同时,并确保保留必要的数据? 这里有三个建议。
1:筛选数据
如果你使用的是机器或者是互联网产生的大数据,你在得到有用信息的同时也接受了许多无用的垃圾。数据过滤可以分离出你想要的信息。
2:导出数据
如果你希望为了将来做长期趋势分析而准备为数据保留个几十年,将这些数据导出到一个值得信赖并基于云计算的供应商是一个不错的选择。这样,在时机成熟时,你就可以自由地将存储的数据导回到你的数据中心进行分析。
3:定义数据保留政策
你可以在定义数据保留政策时表现得强势点。你作为一名数据管理人员,有理由来参与和指定数据保留的政策。这是具有优秀数据中心管理能力的一个标志。
小结
这会不会解决你所有的大数据存储管理和保管问题?没有,但它会给你的数据中心指明了正确的道路。它还将使你成为一名优秀的数据管理人员,能够宏观地预测数据方向和参与数据保留政策的制定。
作者:熙文 来源:网易科技
来源: |