登录
首页精彩阅读大数据时代,一般通过什么软件收集、分析和可视化数据​_数据分析师
大数据时代,一般通过什么软件收集、分析和可视化数据​_数据分析师
2014-11-09
收藏


大数据时代,一般通过什么软件收集、分析和可视化数据_数据分析师



在大数据时代,一般都是通过什么方法收集、分析和可视化数据的?

作为非平台运营商有没有办法收集到数据呢?假设说新浪微博每天有一亿条更新的微博,那么这些数据是不是只有新浪才能收集,第三方是没法收集的呢?

如果收集到了数据,一般是通过什么分析软件来分析呢?然后最后可视化输出又是通过什么软件呢?

解答:

数据是平台运营商的重要资产,可能提供API接口允许第三方有限度地使用,但是显然是为了增强自身的业务,与此目的抵触的行为都会受到约束。

收集数据主要是通过计算机和网络。凡是经过计算机处理的数据都很容易收集,比如浏览器里的搜索、点击、网上购物、……其他数据(比如气温、海水盐度、地震波)可以通过传感器转化成数字信号输入计算机。收集到的数据一般要先经过整理,常用的软件:Tableau和Impure是功能比较全面的,Refine和Wrangler是比较纯粹的数据整理工具,Weka用于数据挖掘

Hadoop是一个能够对大量数据进行分布式处理的软件框架。用于统计分析R语言有个扩展R + Hadoop,可以在Hadoop集群上运行R代码。更具体的自己搜索吧。

可视化输出的工具很多。建议参考wikipedia的“数据可视化”条目。

Tableau、Impure都有可视化功能。R语言也可以绘图。

还有很多可以用来在网页上实现可视化输出的框架或者控件。

大致基于四种技术:Flash(Flex)或者JS(HTML5)或者Java或者ASP.NET(Silverlight)

  • Flash的有Degrafa、BirdEye、Axiis、Open Flash Chart
  • JS的有Ajax.org、Sencha Ext JS、Filament、jQchart、Flot、Sparklines、gRaphael、TufteGraph、Exhibit、PlotKit、ExplorerCanvas、MilkChart、Google Chart API、Protovis
  • Java的有Choosel、google-visualization-java、GWT Chronoscope、JFreeChart
  • ASP.NET的有Telerik Charts、Visifire、Dundas Chart
  • https://www.cda.cn/


数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询