初级阶段的大数据应用如何继续前进
2013-04-02 机房360 编辑:轶名
大数据正被热炒,我们也经常会听到大数据在疾病预测、能源勘探、股市预测等领域的应用取得了一些突破,但并非所有的大数据应用都获得了成功,大数据分析如果失败,那么往往也会导致在这上面的投资打了水漂。所以对大数据分析我们应该提出新的更高的要求,我们更需要认识到下一代解决方案必须满足:
1.授权领域专家
数据科学家出现的频率已完全跟不上企业的需求。这里不妨这么做,停止继续为他们(数据科学家)开发工具;取而代之的是,给商业用户(生物学家、地质学家、安全分析师等)开发对应的工具。他们比任何人都明白问题出现的环境,但可能跟不上最新的技术或数学。
2.加速探索
我们需要更快的获得关键见解。事实证明大数据技术的处理速度并没有承诺的那么快。如果一直这样发展下去,可能我们永远都得不到足够快的关键见解获得速度,因为我们永远都不可能针对所有数据提出所有的问题。
3.人机整合
为了更快的获得见解,我们需要加大对机器智能的投资。我们需要机器能在数据点之间寻求连接和关系时担当更多的重任,让其给商业用户一个更好的起点去探索见解。事实上通过算法途径解决这些问题是完全可行的,并且人们本身永远都不可能发现大型数据集上的显著特征。例如在最近的一项研究中,通过算法查询网络搜索引擎日志发现了之前未报告过的药物副作用。
4.分析各种形式的数据
当然,研究人员需要分析结构化和非结构化的数据。同样我们需要认识非结构化数据的多样性:所有语言、声音、视频和面部识别文档。
在大数据演变过程中,我们现在只处于其初级阶段。显而易见如果我们继续分析百分之一的数据,那么我们只能挖掘其1%的价值。如果我们能够分析其它的99%,那么想象一下我们可以从各种方面推动世界进步。