大数据
    作者:贾凯强

    动不起来的大数据都是发酵中的垃圾

         [ 中关村在线 原创 ] 暂无评论

      动态数据分析以求稳

      在采集和分析部分实现动态后,数据分析才是真正的核心存在。毫无疑问,数据分析的核心是算法和数据,而在数据发分析时普遍可以先分为数据处理和分析两个环节。

    动不起来的大数据都是发酵中的垃圾

      数据分析的算法是十分挑剔的,其对于不同的数据要求不同,一般来讲,结构化数据和非结构化数据就是典型的不同种类的数据,其处理方式相差甚远,因此需要先进行数据处理,将不同种类的数据根据分析目的进行异构解析或者压缩,然后进行分析得出指导性理论。

      在分析方面,算法对分析结果的影响是十分明显的。从数据中根据分析目的选取不同算法,获得分析结果。但是问题在于,这种以目的驱动的数据分析筛选过程所去除的数据难以确定是否真正的无关,这就导致最终分析出的结果很可能是出现偏差的。

      此类问题的解决普遍采用的是利用算法进行分析和精简的,单一算法的偏差难以避免,片面数据的解析同理。而如果全面分析时,静态数据难以保持新鲜度,全面分析计算量过大而且缺乏针对性。

    动不起来的大数据都是发酵中的垃圾
    数据分析面临挑战

      如果采用动态的实时处理手段则可以避免这些问题,数据及时的处理后得到结果作为一种“数据”进行处理,在需要时进行二次消化,比传统方式要容易一些。而这种方式的问题在于目前的技术限制可能会让实时处理结果依然面临算法单一的挑战。

    提示:支持键盘“← →”键翻页
    本文导航

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询