最近跟朋友聊起大数据技术,突然发现这些天天挂在嘴边的工具名——Flink、Kafka、Hadoop——背后居然藏着这么多好玩的故事。今天就跟大家唠唠,这些技术大咖们起名时的那些小心思。
卡夫卡的小说,成了程序员的噩梦?
先说Kafka吧。这名字是不是听着耳熟?没错,就是那位写《变形记》的捷克作家弗兰兹·卡夫卡。听说LinkedIn那会儿的监控系统老出bug,排查问题就跟进了卡夫卡小说里的迷宫似的,又压抑又荒诞。后来他们搞了个新系统,干脆就叫Kafka,算是跟过去的痛苦说拜拜了。
创始人Jay Kreps也是个文艺青年,大学修了不少文学课,特别喜欢卡夫卡的作品。用作家名字给技术项目命名,这操作还挺有格调。
两岁小孩起的名字,改变了大数据时代
最暖心的故事还得是Hadoop。2006年,Doug Cutting在给分布式文件系统起名时,转头看见两岁儿子正抱着黄色玩具大象玩。“Hadoop!”小孩奶声奶气地叫着。Cutting一拍大腿:就是它了!
他说起名就得像小孩起名那样——简单好记、没啥深意、别人还没用过。谁能想到,这只玩具大象后来成了大数据时代的标志呢?现在全球数据在Hadoop上跑的时候,背后其实是个爸爸对儿子的爱。
雅虎的“动物园”是怎么开起来的?
雅虎那帮程序员也是够逗的。先有人随口说了句“叫Pig(猪)吧”,大家觉得这名字又怪又好记,就这么定了。结果Pig还带出了一套命名体系:Pig Latin是语言,Grunt是shell,PiggyBank是共享库。
接着又来了Hive(蜂巢)。数据像蜂蜜,计算集群像小蜜蜂,Hive就是存蜂蜜的蜂巢。Logo更绝——大象头配蜜蜂尾巴,意思是计算得像大象一样猛,扩展得像蜜蜂一样灵活。
后来项目多了,首席科学家开玩笑说:“咱这儿快成动物园了!”大家一合计:“那协调这些项目的系统,就叫动物园管理员(ZooKeeper)呗!”得,大数据动物园正式开业。
德国人的严谨,松鼠的灵活
Flink这名字来自德语“flink”,意思是“又快又灵巧”。别说,这名字起得真准,Flink处理数据流就是又快又灵活。Logo是只棕红色松鼠,因为松鼠也是出了名的灵活好动。
从德语词到松鼠形象,这命名思路挺完整。
希腊神话也来凑热闹
Doris是希腊语里的“礼物”或“海洋的馈赠”。在神话里,Doris是位海洋女神,管着渔场和干净水。百度当初开发这个分析型数据库时,估计是希望它像女神那样,给数据分析领域带来点“馈赠”吧。
程序员的自嘲,你get到了吗?
YARN这名字典型程序员幽默——“Yet Another Resource Negotiator”(又一个资源协调器)。那种“这玩意儿没啥特别的,就是又一个协调器”的自嘲感扑面而来。
巧的是YARN英文原意是“毛线”,后来Facebook出的JavaScript包管理工具也叫Yarn(毛线球)。据说是因为开发团队被猫主子控制了——猫玩毛线球,没毛病!
也有老实人
在一堆有故事的名字里,HBase显得特别实诚——就是Hadoop Database的缩写。简单直接,一看就知道是Hadoop的数据库组件。
星星之火可以燎原
Spark意思是“火花”。创始团队希望这产品能点燃基于Mesos的几款创新产品。结果它真成了火花,把内存计算这把火烧遍了大数据圈,数据处理速度翻了几十倍。
起名也是个技术活
看看这些名字,能发现点规律:
动物系最受欢迎:大象、猪、蜜蜂、动物园……技术圈对动物是真爱
多语言混搭:德语、希腊语、捷克语都有,技术无国界嘛
名如其“人”:大多数名字都跟技术特点对得上,比如Flink的快、Hive的存、Spark的点
有温度:很多名字背后都有个人故事,不是冷冰冰的技术词
搞技术的常说代码是冰冷的,但看看这些名字背后的故事——有父子温情,有文学情怀,有同事玩笑,有文化融合——其实技术也挺有温度的~~