大数据

    五大尴尬掣肘大数据

         [ 中关村在线 原创 ] 暂无评论

        云计算是大数据的运行平台,非结构化数据爆发式成长,大数据的智能分析和决策被粉饰的神乎其神,不过针对应用领域,还有四个要素将影响大数据发展:

        1.预测后不敢用

        如果把大数据比作算命显然有点欺负了这位IT新宠,但从目前的大数据分析领域看,在很多行业应用上还存在敢测不敢用的尴尬,预测结果更多是印证而不是代替决策,除了大数据本身预测准确率以外,系统性风险带来的决策失误很可能最终让大数据背锅,信息部门以及咨询机构凭空担了责任,想想就觉得冤枉。

        2.信息不对称

        大数据体现在一个大字上,是一个公司的数据还是一个行业的数据还是合纵连横参考多个维度数据来做的最终分析?实际上各个“大数据库”如一个个信息孤岛,彼此缺乏联动,而单一通过某个孤岛来决策自然生态显然是盲人摸象,不准也就不足为奇了。

        3.非结构化难解人性

        结构化数据的最大特点是基于考量数据做推演,总结过去做预测,可当前大数据面临太多的非结构化数据,这里包含了庞杂的社会信息和干扰信息,如果我们按照结构化数据的方式来看,从过去10年情况来预测今年的走势,也许会得到一个波动不太大的结果,但如果我们发现某位用户衣服买了绿色,裤子买了绿色,衬衫买了绿色,然后系统认为用户在服饰选择上偏爱绿色的话,那有一天用户想买顶帽子时,系统推荐的商品也许会激怒用户。

        这应该是大数据面临最尴尬的一点,如果说大数据是基础,深度学习和人工智能才是关键,因为这两项必须依靠大数据作为基石,会让决策准确度实现指数级提升,当这两项技术水平得到了解放,大数据才完整体现了价值。

        4.使用过期数据

        数据的新鲜程度将极大影响最后的分析结果,不同的行业的数据保鲜时间也会有很大差别,例如服装业的潮流变化速度明显快于其他行业,很多大数据最终结果偏差都是由于数据更新的不及时性导致,因此如何确保数据不断随时更新对于大数据来言是一个很大的挑战。

        5.走不出安全隐私困局

        安全是一个永久话题,数据越多,泄露后带来的风险和损失越大,“大数据库”越大,一锅端后看着越辣眼睛。

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询