飞天是如何从“骗子”变成“娇子”的?

2021-06-11 网络
浏览
[人工智能]飞天是如何从“骗子”变成“娇子”的?

——飞天,阿里云12年前种下的一粒种子,现在已经蔚然成林。

在今年的阿里云北京云峰会上,飞天宣布了三大升级:一云多芯、内陆Region、盘算巢。

一云多芯,阿里云在飞天加持下,能够兼容x86、ARM甚至当下热门的RISC-V等多种芯片架构,以尺度化的云盘算服务拥抱未来更多可能性。

内陆Region,阿里云让公有云从中央延伸到内陆,让这朵盘算的云更靠近地面。

盘算巢,通过向PaaS同伴开放飞天手艺底座,让云上客户获得更好的PaaS服务,从而大幅降低上云成本。

这三大升级,从手艺上扫平了阿里云服务种种用户的屏障,包罗政企。而这一切,阿里云要谢谢他们缔造了飞天。而飞天也注定将成为这个时代的符号——云盘算在飞天的操控之下,让万物能够随时随地被毗邻、盘算、智能化。

谁都知道,飞天不是一夜之间一飞冲天的。甚至在最最先,飞天种种被嫌弃。

“骗子”

这是段IT江湖耳熟能详的故事。

2008年,阿里巴巴确立云盘算战略,开启了自研飞天的征程。

砍掉小型机、弃用Oracle数据库和EMC存储装备——阿里云还没出生,就要释放“去IOE”这头怪兽,难度可想而知。

用阿里云首创人王坚的话来说,这个征程不是爬香山,而是向珠峰进发。

2009年,飞天的第一行代码降生。然而,这行代码将会链接到一个什么样的未来,所有人都没有谜底。

飞天第一行代码

万事开头难。在阿里云初创时代,“捆绑创业”被发现出来。被捆绑的是阿里金融(即蚂蚁金服的前身),阿里金融的“牧羊犬”项目成为阿里云第一个客户。

“牧羊犬”是这样一个项目:要用数据和盘算去解决中小企业融资难的问题。彼时正值移动互联网时代大幕初启,这个逻辑没有任何问题。但阿里金融总裁胡晓明被要求,必须基于阿里云。

昔时,OpenStack已经公布,市场纷纷拥抱开源。这边厢却要从零最先搭建飞天,胡晓明和团队十分费解,但最终都被一句“阿里云是未来”顶了回来。

怎样,初生的阿里云经常泛起不稳固和数据错误的情形。

由于系统经常失足,漫衍式盘算被讥讽是“分步试盘算”;专人24小时盯着系统,阿里云又被戏谑是“人肉云盘算”。

与此同时,阿里金融营业开展步履维艰,但也不得不咬牙坚持。因该项目名为“牧羊犬”,阿里内部自嘲这是“吃自己的狗粮”。

自嘲归自嘲,现实的痛是刀刀到肉的。Bug不停,项目赔钱,团队出走——最严重的时刻,百分之七八十的工程师陆续脱离。

阿里云和飞天被嫌弃之状,大致云云。

带着“骗子”的标签,阿里云终于完成了从0到1到突破。

2012年阿里年会,王坚在台上掩面落泪,那一刻的百感交集,只有履历了才知道。

阿里巴巴将这一年的“飞天奖”颁给阿里云所有员工,颁奖词是:“坚持就是伟大。”

“骄子”

从被嫌弃到酿成阿里骄子,2013年是个分水岭。在这一年,借助飞天,阿里云一次性将5000台服务器的盘算性能整齐一致。

这是一场漂亮的翻身仗,也是一个标志性的里程碑——阿里云成为天下上第一家对外提供5K云盘算服务能力的公司。

算力底座宣告完工。昔时,阿里云最后一台小型机下线。

2015年,12306部署在飞天上,阿里云为其分流了春运岑岭75%的流量,一战成名。

云盘算自此风靡,但飞天没有住手升级。2016年,阿里云针对虚拟化的开销做了架构和产物的研发,“神龙架构”破壳而出。

“神龙”之后,“盘古”存储、“洛神”网络平台、“玄武”高性能服务器……阿里云都有了。它们配合融合成为壮大的云平台,支持阿里云将盘算资源像供水供电那样送到万千用户。

基于飞天,阿里云把水井酿成自来水。

2017年,“飞天云操作系统焦点手艺及产业化”项目获得中国电子学会科学手艺奖科技提高奖特等奖,这是该奖项设立15年来首次揭晓的特等奖。

后面的故事,可以直接上数字语言。

阿里近期公布的2021财报数据显示,阿里云市场营收突破600亿元,同比增进50%,成为推动阿里巴巴团体整体收入增进的主要引擎。

IDC最新公布的《全球及中国公有云服务市场跟踪》显示,2020年全球IaaS市值到达671.9亿美元,同比增进33.9%,亚马逊、微软、阿里巴巴坐稳前三,“云盘算3A”无可撼动。

一云多芯

在这次阿里云峰会上,飞天携三大升级再次进入人们视野,以“做深基础”之姿,行“做厚中台”之便——根深才气叶茂,厚积然后薄发,阿里云通过飞天对百万台服务器的盘算能力系统化、建制化、尺度化,最终通向云盘算的“做强生态、做好服务”。

三大升级中,“一云多芯”可谓光泽万丈,被业内津津乐道。人人以为,这是飞天提升能力、提供更厚实云盘算部署形态的一大步,是阿里云向广漠政企市场提议冲锋的一个信号。

诚然。但“一云多芯”所谋深远。它要解决的是什么行业命题?且看——云平台治理的盘算节点越来越多,很快面临到这样一个问题:差异CPU架构的盘算节点,很难统一治理。好比一个云平台上既有x86架构节点、又有ARM节点,往往用两朵云分而治之。

这样的利益是,x86(庞大指令集)和ARM(精简指令集)可以各自觉挥传统优势,以性能、功耗之长等划分适用差异场景。

然而,市场对盘算的需求是动态转变的。

举两个例子。

一个是,英特尔最新公布的至强Ice Lake芯片中的平安盘算指令集SGX,给解决多方可信盘算问题提供了可行性,这对于云盘算在一些要害行业如医疗、金融等的使用异常主要。这些领域对于既能打破“数据孤岛”、施展数据价值又能做到“数据可用不能见”的可信盘算或平安盘算有更大的买单感动。

另一个是,人工智能模子对算力要求越来越高,且往往规模越大的AI模子越能展现出更好的AI性能。因此创业者和开发者希望通过AI云用上最新的、参数规模更大AI模子。在提高AI算力方面,平头哥先后推出的多款产物,包罗RISC-V处置器“玄铁910”和强劲的AI推理芯片“含光800”,可通过AI云服务为AI场景提供汹涌AI算力。

再如英伟达今年4月公布的基于ARM的数据中央CPU芯片“Grace”,将CPU与GPU之间的通讯速率提高近10倍,使其具备更强的AI推理能力。

那么问题来了,若是用户既想要超强的AI推理能力,又希望举行多方平安盘算(这在政企市场有望成为主流需求),怎么办?

此前的方案是多云协同,但那样需要给ARM集群和x86集群划分提供存储与网络的配套,不仅虚耗资源,还要分外关注多云协作的治理开销。

而阿里云的一云多芯,能够做到用一套云操作系统(飞天)来治理差异架构的硬件服务器集群,将差其余架构的CPU算力尺度化,进而从根上解决差异类型CPU共存所带来的多云治理问题。

云为中央

从这一视角可以看到,云盘算已不是单纯的盘算力,而是酿成一个系统化的创新集成体,它往往要瞄准关乎IT生态生长的问题。

无怪乎张建锋在阿里云峰会上说:“对阿里云来说,云盘算是一个伟大的产业转变的时机,也是一个伟大的手艺转变的时机——数字创新的云将面向所有开发者。”

简直,在算力经济时代,云越来越成为手艺转变的中央。已往以芯片为焦点的IT创新仍在施展作用,只是已经成为云盘算的附庸——用户并不必体贴盘算节点的组成,也不用在意服务器的组合、芯片架构甚至型号,只要能通过云盘算获得最适用的算力或SaaS服务就够了。

这是云盘算生长趋向于成熟的一定。这自下而上地驱动云厂商不停加速创新、做深基础,不停厚实生态、做厚贮备积累。对于阿里云来说,就是如张建锋所言,在重大的手艺系统中做自己的创新,然后向上重塑手艺软件,最后出现SaaS化服务。

阿里云当初坚定打造“飞天”,让这一切变得“容易”起来——无论手艺系统内诸如神龙架构、POLARDB云数据库等的创新,照样自此塑就的云钉一体、盘算巢、内陆Region,都离不开飞天这个手艺底座。

飞天手艺底座

可以说,飞天在解决人类盘算规模、效率、平安问题方面取得了空前的成就,在飞天之上,可供使用的算力更强、更通用、更普惠。

飞天也以实打实的成就证实了这一点:十多年来,飞天经受双11、12306春运购票等极限并发场景挑战。现在,阿里云为全球客户部署200多个飞天数据中央,通过底层统一的飞天操作系统,为全球用户提供云盘算。

梦回十多年前,中国几大互联网巨头只有阿里先发占道云盘算,阿里云最终成为“先驱”而没有成为“先烈”,到底是由于做对了什么?