业内视角:Hortonworks眼中的大数据

分享到:
233
下一篇 >

目前到处扩散的朦胧定义还不足以清晰表达大数据所带来的收益,Hortonworks公司的一位高管如是说。今天我们要从业内人士的视角出发,看看他们眼中的大数据到底是怎么一回事。

那么,大数据到底是什么?这一般技术人员会用经典的3V模型来解释——容量、速度以及数据多样性——这种说法几乎成为行业惯例。不过这种流行定义太过含糊不清,并没大数据的宗旨在于“以全社交媒体、服务器日志、Web点击流、设备/传感器以及地理位置。

但企业用户要如何使用这些信息?

先来看社交媒体数据。企业目前已经开始利用Facebook、*******以及此类社交“如果我在我的网站上追踪每一条单一入站请求,并根据地理区划对其进行叠加,则能够更好地判断自己的大型客户主要集中在哪些区域、在哪里可能面临潜在的**问题。”

Hadoop带来的点击流数据能够帮助用户对传统数据管理系统的过载状态信息进行高效管理。

“如果我能够捕捉到来自自己网站上的所有点击流数据——当然,这样庞大的数据记录会很快填满现有数据库——也就是由纯粹点击量所产生的数据,”McJannet解释称,“那么将其保存在Hadoop当中……会帮助我根据信息创建出非常有趣的分析应用程序。”

设备数据在很大程度上也属于尚未开发的大数据来源。

“设备**是*大的数据来源之一,其涵盖范围囊括了空调机组、冰箱、货车乃至家用机械等各个常见领域,”McJannet指出。“此类流程将带来爆炸式的数据增长。”

目前全世界的在运行手机达到数十亿部,因此移动数据采集设备具有广阔的市场发展空间。“每一次在通话中经历电话信号塔之间的信息转换,都会产生一部分数据片段。如果有人打算创建分析应用程序,这些信息就会成为非常宝贵的资料基础,”McJannet表示。

地理位置数据受关注时间同样不长,直到十年之前还只存在于宇宙空间技术及军方应用领域。如今它已经为商业应用程序指明了一条发展新路。

举例来说,运输公司完全可以每10到60秒追踪一次各车辆的地理位置数据,并由此积累起PB级别的相关信息。

“如果打算在运营流程中使用地理位置相关数据,大家首先应该考虑自己有能力创建什么样的应用程序以及能够从中提取出哪些有价值信息,”McJannet总结道。

你可能感兴趣: 云计算 业界新闻 Facebook ******* 服务器
无觅相关文章插件,快速提升流量