大数据时代,一个新的相对论时代-CDA数据分析师官网

热线电话：13121318867

大数据时代,一个新的相对论时代

2017-04-17

大数据时代,一个新的相对论时代

今天的社会治理、商业管理以及个人生活，无不在快速地数据化，即事实和细节被广泛地记录下来，通过这些记录，消逝的世界可以再现，从而进行分析和预测，人类历史上一些精细的、微妙的、隐性的、曾经难以捕捉的关系和知识，现在都可以捕捉到，快速上升为显性的知识。

我的结论是，通过数据，人类从来没有如此客观地认知我们每天生活的世界。

从成都返回杭州，有几个小时我在空中飞行。回到家，一封邮件已经静静地躺在我的邮箱。里面是迫切且尖锐的提问：

“涂先生，这个时代，让我越来越困惑，我是一名资深的数据分析师，但随着数据的增多，我甚至成了一名大数据的怀疑论者……之所以没有在现场提问，是担心我的挑战给大数据的信奉者泼上冷水……”

他的问题是，数据越来越多，但他却经常感受到，他离事实越来越远，通过数据，无法发现真正的真相。

换句话说，虽然数据是真实的，但它却不一定符合真正的事实。

这是一个新的相对论，数据相对论。爱因斯坦的相对论是关于时空和引力，新的相对论是关于数据和事实。

数据永远在追赶事实

美国政府曾经竭尽脑汁，一直想掌握全国真正的人口数量。1860年代开始，美国总统就开始给美国的普通公民写信，请他们不要因为害怕人口普查而隐瞒人数，他以总统的名义保证，这些数据只是为了掌握美国的真实人口数量，而不会用于征税、征兵和法庭调查等其它用途。此后历届美国总统都致力于排除人为因素，力图保证数据的客观性。他们还想方设法缩短普查时间，最初一次普查要两年时间才能完成，到后来慢慢缩短至两个月，乃至两三天。

每时每刻，都有人出生、死亡或者濒临死亡，他们发生在不同的家庭、医院、甚至野外，现实不会静止以等待你给它画像，任何一次人为组织的人口普查，都没有办法在同一个时间点掌握全部的这些事实，从而计算出一个时间点这个世界真正的人口数目。

直到今天，信息技术、互联网、手机如此发达，这个问题还没有解决。

人类是这个世界的灵长，迄今为止仍无法准确的掌握这个星球上有多少同类，遑论其他？

世间万物，一颗红豆、一碗牛肉面、一台汽车、一段感情，其中的知识，都往往丰富得我们难以想象，所谓一花一世界、一叶一菩提。

世界之大、包罗万象、周行不殆、须臾万变，人类就像刻舟求剑的楚人一样，能掌握的永远只是某一个节点某一个范围内的小事实，有混乱和困惑是再自然不过的事了。

但在纷繁复杂、持续演变的世界，人类又在不断努力。纵使人口不断变动，美国政府亦不断改进数据获取方式，以提高效率、逼近真相。今天的美国人口普查局，已经开发了一个“人口钟”（population clock），每分钟可以预测一次美国人口的变化情况。

数据永远在追赶事实，就像永不停歇的钟摆。在追求真理的道路上，我们进入了一个更为清晰的相对论时代。

数据仅记录事实的一个侧面

十年前，我刚到美国留学。开学不久，就学到了一件重要的事情，必须区分“事实”和“观点”，至今还记得，教授在课堂上第一次引用这句名言：“每个人都可以有他自己的观点，但不可以有他自己的事实”，我从此引为圭臬。

但随着经验和阅历的增长，我又感悟到，大千世界，之所以意见纷争、共识稀少，还是因为每个人拥有他自己的事实，事实确实只有一个，但一个事实却有千万面，人因为自己的局限，往往只能看到自己认同的那一面，很少有人能面面俱到、看到一个事实的全貌。

导致的结果，各人还是各有“事实”。

这真是个很可怕的结果，数据越多，分歧也可能越多，因为每一个不同的观点，都能找到相应的数据来支持，一定程度上，比没有数据还糟糕。