
MySQL 创始人:写代码比打游戏还爽,程序员应该多泡开源社区
编者按:根据StackOverflow的最新调查,MySQL仍然是全世界最流行的数据库,受访的开发者中有44.3%的人在使用,超过了第二位的SQL Server 10多个百分点。可是你知道MySQL是怎么诞生的吗?openocean 的一篇有关MySQL开发者Michael “Monty” Widenius的传记为我们揭秘。
大学计算机专业的数量总是会随着技术公司的兴衰而起伏,而现在,计算机科学正处在全盛时期。这意味着,不管怎样,计算机科学专业的毕业生绝大部分可能都会去敲2年的代码,再转到产品管理,然后过渡到企业、创业或者商学院,接着再转为既有公司的中层管理,32岁的时候结婚,有了2个孩子,一个儿子,一个女儿,一条狗,还有一栋2层的漂亮房子。对于大多数人来说,成为程序员就是一份朝九晚五的工作,一份有保障的6位数薪水来偿还高昂的学费,一种达到目的的手段,没人应该为此受到责备。但对于千千万万无论好坏的程序员来说,只有一个Monty Widenius。
Monty是一位编程天才。19岁的时候,他从赫尔辛基理工大学辍学开始全职工作,因为大学已经没有什么东西可以教他了。在独自一人写完除了一个库以外的全部代码之后,33岁时,他发布了MySQL,后来后者成为了全世界最流行的开源数据库。55岁时,他藐视着对老年人的歧视,仍然是自己公司最好的程序员。
Monty1962年出生于赫尔辛基,1978年他用暑假铺沥青挣来的钱买下自己的第一台个人计算机的。Monty迅速意识到自己相当擅长写代码——对于别人来说很复杂的事情他却觉得很简单,而且他对工作非常投入。Monty用一种在讲瑞典语的芬兰人中常见的浓厚口音说:“基本上这就像是在阅读一本真的非常非常好的书。或者像在玩视频游戏。你知道开始玩游戏然后嘣一声3小时的时间就过去了的那种感觉吗?写代码对我来说就是这种感觉。”
当别人跑去聚会的时候,Monty却呆在家里编程。他把计算机从里到外都摸透了。他把BASIC的能力推到了极限。Monty说:“学校并不理解编程不是像语言或者历史这样的东西,它不是靠学就能学来的。所以学校是不够的。拔尖的黑客是万里挑一。他们奉献了所有能用的时间,10小时,16小时,每一天,年复一年周而复始。大多数人都不愿意做这样的事情。大多数人宁愿好好生活。”在Monty眼里,好的代码是写过一次就永远不需要再碰的那种。从性能角度来看它已经是最优化了,你可以不断增强,但永远都不需要重写。
到1980年,17岁的Monty痴迷编程已经无法自拔,他需要把自己计算机的内存从8KB扩到16KB。由于芬兰没有商店卖他想要的东西,于是他弄了一条船去到瑞典Allan Larsson的计算机商店。通过Allan,Monty结识了David Axmark,三人沟通交流了多年,就各自项目互相帮忙,偶尔也会一起协作。1995年,他们一起成立了MySQL AB。Monty负责编程,David和Allan负责干完其他的事情。自1981年以来,Monty就一直以芬兰公司Tapio Laakso Oy程序员的身份在写MySQL前身的代码,他和Allan一起创办的数据仓库公司也要用到那个东西。然而,知道1995年,在Allan和David的游说之后Monty才决定在他写的东西之上增加一个SQL层。1996年10月,MySQL终于发布了,它得到了广泛的欢迎。MySQL快速、可靠并且易学,这主要是因为在多年的开发中Monty总是不断把正是客户的反馈整合进来。
MySQL的初衷是存储和管理大数据。如果有人想要跟踪不同的数据点,他们互使用数据库,也就是有点像微软Excel那样的东西。然而,随着数据变得越来越大,查找Excel这样的数据库就会变得慢多了,也不再可靠。MySQL有能力存储大量数据,并且返回搜索结果极其迅速。“My”来自Monty女儿的名字,而“SQL”就是结构化查询语言(Structured Query Language)的意思,是一种跟数据库沟通的语言。
对MySQL开源的决定出自1985年的另一次芬兰到瑞典的乘船旅行,这一次是在一场开源大会上。Monty说:“讨论没花多少分钟。我们都希望回馈给开源社区一点东西。哪怕有人想拷贝或者偷盗我们的代码,我们认为自己能挣的钱也不会比现在少。”开源项目使得开发者社区帮助把软件做得更好,但从商业角度来看不好的是货币化就要困难多了。为了避免这一点,Monty补充了一个条款,那就是如果任何企业用MySQL来赚钱的话,就需要付费授权。对此MySQL的代码里面并没有进行任何限制,但就靠这一荣誉制度MySQL实现了扩张并开始赚钱。Monty说:“我认为开源是开发软件的更好方式。但你仍然需要赚够钱来招聘员工,成立公司去跟闭源社区竞争。MySQL是第一款做到这一点的产品。”
Monty在MySQL AB的职位是CTO,对于大多数成熟的公司来说,CTO其实已经很少再编程的了。然而,Monty从未停下来过,他的绝大部分时间都是在写代码。这种(很少管理的)做法会导致很多晚期阶段初创企业内爆,但哪怕公司人数已经达到550人,Monty在MySQL AB建立的独特文化也使得他可以避免天天开会的烦扰(事实上,Monty甚至都不接受议事日程邀请)。Monty说:“我总是招会自动驾驶的人进来。所以我不需要告诉他们太多东西。而开源意味着你有开源社区,大家会给你提供代码,你可以看看那些代码的质量,看看他们是怎么跟社区互动的,跟你是怎么沟通的,他们会问什么问题,在这些情况下很容易就能看出一个人是好是坏。在一次面试里面是很难了解清楚编码者有多好的。”
MySQL的成功是CTO Monty与CEO Mårten Mickos通力协作的结果。两人能力都很强且对公司非常重要,但方式不一样。Monty是技术专家,专注于员工生产出尽量完美的代码。Mårten是公司建设者,专注于交付东西并帮助团队发展。正是两人的联合愿景制造出了MySQL。但在一家没有免费洗衣、免费午餐、站立办公桌的公司里,是Monty的个人魅力吸引住了人才。Monty不是好交际的筹资人,讨好别人的人,博弈论大师,或者职业沟通者。他会写代码,而且写得很好。在Monty看来赢得开发者尊重是很简单的事情:“你干的是跟他们一样的事,而且干得更好。”
Monty给程序员的建议是,参与到开源社区去,花些时间到个人项目里面(“这些年来我开发了成百上千个程序:MySQL是其中被用得最多的一个,但其他的都只有我自己用。”)。他警告说,改变环境和代码库将意味着哪怕是最好的程序员也要去了解一堆的东西。在Sun被Oracle收购之后,Monty成立了MariaDB,这是MySQL的一个社区版的分支,开发的团队成员很多都是MySQL团队里面的,使用的也是一样的官方语言:“蹩脚的英语”。MySQL的许多热心的开源信徒跟着Monty去到了MariaDB。MariaDB更加面向开发者,允许由外人打补丁这样的事情发生,在很多Linux发行版中它都是默认的数据库。
Monty对开源和开发者的承诺是坚定的——OpenOcean原先是Monty用自己在MySQL的所得成立的,使命是投身于开发者驱动、有技术深度的产品。他仍然在赫尔辛基自己家中主持开发者午餐,很快OpenOcean就将推出一个Slack频道让开发者可以直接向Monty提问。在几十年的时间里,Monty对塑造开源社区无私的形象做出的贡献无可争议的。但这里面大部分的功劳都应该归到成千上万无名的程序员和黑客身上,是他们投入的时间和能力造就了开源的繁荣,也是这批人才能确保开源革命的继续。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01