数据库专家Michael Stonebraker获得2014年图灵奖
2017-10-07

http://img.my.csdn.net/uploads/201503/25/1427296923_1047.jpg

ACM官方刚刚宣布,Michael Stonebraker因“对现代数据库系统底层的概念与实践所做出的基础性贡献(For fundamental contributions to the concepts and practices underlying modern database systems)”而获得2014年图灵奖。他也是数据库领域自1973年Bachman(数据库与网状数据库)、1981年Codd(关系数据库)、1998年Gray(数据库与事务处理)之后的第四位图灵奖得主。

另外要特别指出的是,由于Google的赞助,这是图灵奖历史上第一次奖金提升到与诺贝尔奖相当(100万美元),之前的金额只有25万美元。

许多人包括我得知这一消息马上的反应是:太实至名归了。Michael Stonebraker在数据库领域以多产而著称,“发明了许多几乎所有现代数据库系统所用的概念,创办了无数成功的数据库技术公司”的确是他几十年生涯很好的总结。

他的影响跨越学术界和产业界,很难有在世者能与之媲美。而且此前他已经斩获美国工程院院士、IEEE软件系统奖、冯诺依曼奖和第一届SIGMOD Edgar F. Codd创新奖等多个重量级荣誉。

早在1970年代前期,Michael Stonebraker就在Edgar Codd的关系数据库论文启发下,组织伯克利的师生,开始开发最早的两个关系数据库之一Ingres(另一个是IBM System R),Ingres的基础上后来发展出Sybase和SQL Server两大主流数据库。Ingres在关系数据库的查询语言设计、查询处理、存取方法、并发控制和查询重写等技术上都有重大贡献。

1980年代他又开发了POSTGRES项目,目的是在关系数据库之上增加对更复杂的数据类型的支持,包括对象、地理数据、时间序列数据等。后来这个系统演变为开源的PostgreSQL,Greenplum、Aster Data、Netezza和Stonebraker自己创办的Ilustra(后被Informix收购)等多个商业公司和开源的产品都是基于PostgreSQL开发的。

1990年代,他启动了联邦数据库Mariposa,基于此创办了Cohera公司,后被PeopleSoft收购。Mariposa和稍早的XPRS(与Randy Katz、David Patterson和John Ousterhout诸位大牛合作)和Distributed Ingres两个项目开了一代分布式数据库风起之先。Shared Nothing架构这一重要概念也是那个时期提出来的,这已经成为如今大数据系统的基石之一。

2001年到MIT后,他更是马不停蹄,有段时间几乎每年都会与多所大学合作开发一种新类型的数据库或者数据处理系统,并创立一家公司:

  • 2002年,流数据库Aurora,以此创办StreamBase公司,产品用于许多金融机构的CEP系统。公司后被TIBCO收购。
  • 2005年,并行的列式数据仓库系统C-Store,创办Vertica公司,后被HP以3.4亿美元收购。
  • 2006年,数据集成项目Morpheus,并据此创办本地搜索公司Goby。
  • 2007年,分布式内存OLTP系统H-Store,创办VoltDB公司,已获得1360万美元投资。
  • 2008年,数组数据库SciDB,创办Paradigm4公司。
  • 2013年,70岁的他还与一个卡塔尔的年轻人共同创办企业数据集成公司Tamr,次年获得Google等1600万美元投资。

看到这里,已经足够让人吃惊了吧。还没完呢,再看看Stonebraker的学生列表:

  • Daniel Abadi (Hadapt联合创始人)
  • Michael J. Carey (UC Irvine教授,美国工程院院士,ACM Fellow)
  • Robert Epstein (Sybase创始人)
  • Diane Greene (VMWare创始人)
  • Paula Hawthorn (Britton-Lee创始人,曾任Informix研发副总)
  • Marti Hearst (UC Berkeley教授,ACM Fellow)
  • Gerald Held (曾任Oracle研发副总)
  • Joseph M. Hellerstein (UC Berkeley教授,ACM Fellow)
  • Anant Jhingran (IBM信息管理部的副总兼CTO)
  • Mike Olson (曾任Sleepycat和Cloudera的CEO)
  • Margo Seltzer (哈佛大学教授,BerkeleyDB的作者)
  • Dale Skeen (Tibco副总,Vitria创始人)

如果再算上与他有过合作的同学,比如TokuDB的John Partridge,估计整个美国搞数据库的公司和核心人物,无论是SQL、数据仓库、NoSQL、大数据还是NewSQL,都免不了与他有千丝万缕的关系。

Michael Stonebraker的可贵之处正在于理论与实践两手都硬,而且他不局限在学术界,而是经常与技术社区分享自己的真知灼见。2007年,他撰文告诉大家,现有通用数据库的技术都过时了,普适技术将拼不过针对各种场景专门开发的技术。2010年MapReduce/Hadoop正火,他与Jeff Dean等针锋相对论战。2011年,他又为NewSQL运动摇旗呐喊。很多时候他的观点都引起了业界的激烈争论,也有很多不明真相的批评与指责。2013年,他在CACM博客里撰写系列文章解读大数据。现在回过头看Stonebraker的工作,才发现各种东西其实都是人家n年前玩过的,不仅有论文,还有公司和客户,他当然有发言权!

他比较新的观点认为,数据库领域可以有很多赢家,“将有3到5个,甚至6个非常不同的数据库系统架构成为赢家,而在每一类下都会有2到3个成功的供应商。传统的关系型数据库系统将慢慢收缩,这一切转变也许需要十年。”

Stonebraker教授作为数据库界的权威,还编辑过一本红宝书Readings in Database Systems,收集了最有价值的数据库领域论文,现在已经出到第4版,极具价值。(这个网站收集了老版论文的可下载链接)