
大数据时代细说“大数据”
“大数据”的浪潮正席卷而来,对各行各业都产生革命性影响,在有些领域产生的影响极可能是颠覆性的,并终将改变整个世界。作为“国粹”的书法艺术,带着老古董式的清高与孤傲,或许是受到“大数据”影响最小的。然而,书法家不能袖手旁观,等闲视之,而应迎头赶上,顺势而为,做时代的弄潮儿。这是因为,在“地球村”时代,固守书斋的做法已经不合时宜。
大数据主义认为,历史上90%的数据都产生于过去两年。国际数据公司推算出2014年全世界的数据总量有4.4泽字节之多,也即4.4万亿兆字节,如果把这么多的信息塞进纤薄的苹果平板电脑,这些平板电脑叠加起来的高度可达157000英里高,相当于地球和月球三分之二的距离。就书法领域而言,近些年所产生的数据量,恐怕也是史无前例的,请注意,我说的不是书法的质量和高度,而是“数量”。如古代书论,我有几种版本,也就几大册,静下心,花一些时间,还是有可能大致通读一遍的。但是,当今的“书法评论家”,一个人的著作就可以达到十多部、几十部,不久前一位书法家办展览,艺术简历说其著作有八九十种之多,以为有误,后来发现他确实出了那么多书。去北京,一些朋友赠送其著作,是论箱送的,知道我带不动,主动用快递寄达。这样海量的著作,我估计是没有读者吃得消全部通读的。展览活动之多,书法作品集之厚,就更不必说了。当然这不是“大数据”的本来含义,我只是说明当代书法数据之多。
如此海量的“书法数据”,按照传统的方法全部阅读实无可能,如果无法阅读,大量沉淀,这些数据就将成为无用信息,甚至成为垃圾。唯一的解决办法,就是运用网络技术进行统计分析,对所有数据进行整合。你需要什么数据,网络就可以提供什么数据,比如我需要知道赠送我书的朋友对某一观点的看法,通过大数据检索一下,就能立马知道。并且,还可以知道古今书法家、书法评论家持相同、相近观点的所有数据。从古到今,都可以进行点线面的全覆盖。
“大数据”的重要意义远不止此,它可以将古代所有法帖囊括其中,然后按照时代、书体、笔画线条等不同需求进行分类分析,各取所需,各尽其用,对临帖和创作都将产生巨大影响。比如,不久前中国书协取消了第十一届国展的一件获奖作品,这件隶书“君子行道,贤者履仁”对联,引起读者质疑,经查与公开出版物《石门颂集联》上同样内容对联用笔非常接近,属于临摹作品。这样的事例,要用人力完全避免是有难度的,但是如果应用了“大数据”技术,则属于小菜一碟的事情。“大数据”的分辨率是人们所无法想象的。
苹果公司显然敏锐地看到了书法与“大数据”的广阔前景,9月份苹果公司在旧金山举行新品发布会,发布了新版Apple Watch、iPad Pro、iPhone6S等产品,更发布了一件“苹果新神器”——Apple Pencil(苹果铅笔)。他们特邀著名书法家王冬龄先生专程前去做代言人,进行现场书写。他们的宣传片上通过操作演示出现了一只手写书法的画面,写的是草书“冬龄”等字样。虽然不是用毛笔,而是用“苹果铅笔”进行简单书写,但他们的用意是显而易见的。这也为我们认识书法与“大数据”提供了广阔的想象空间。在不远的将来,电脑不仅能够为人们的临帖、书写、创作提供超乎我们想象的便利,而且,“书法机器人”也将应运而生。目前,第一代“书法机器人”已经问世,这套系统通过一支笔杆与笔毛分开的特殊毛笔对书法写作的过程进行记录,其中笔杆部分为主系统,笔毛部分为副系统,两部分连接起来成为这一个记录器,就可以把它当作普通的毛笔来进行写字。我相信智能程度更高的“书法机器人”也将出现。
当然,中国的书法和中国画一样,是一门特殊的艺术,其独特性在于在强调造型的同时,非常讲究气韵、神采、意境,而这取决于艺术家的学养、性情、旨趣等综合性因素,是电脑所无法取代的。智能程度再高的“书法机器人”也绝不可能代替书法家的创造性精神劳动。我写这篇文章的目的,不是杞人忧天,担心“大数据”会取代中国的书法艺术,而是提醒书法家们要有“大数据”意识,熟练地运用“大数据”带来的极大便利,为我所用,为书法事业的腾飞插上翅膀。
毕竟,数据是一种力量,“大数据”是一股潮流。在大数据时代,每个人所做的一切,都将以数据的形式呈现出来,流传下去——如果能够流传的话,甚至人本身也是数据。书法家的成就大小,非常可能将取决于其提供有效“书法数据”的多少。如果我们能够用数据杠杆来推动书法的进步,这无疑是一件顺乎历史潮流的好事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13