多云备份迫在眉睫!阿里云宕机引热议 业内分析或与服务组件有关
财联社 2023-11-15 16:15

日前,阿里云发生重大故障,全线服务宕机3个半小时,引发业内诸多讨论。财联社记者与多位业内人士交流获悉,此次故障或与阿里云的鉴权服务(Auth)有关,多云备份或是杜绝此类重大事故的有效方式。

底层服务组件引起阿里云故障

据了解,不仅阿里系产品全线“崩溃”,阿里云客户的用户购物、企业运营、公共服务等都受到不同程度影响。据阿里公告,从11月12日17点44分开始,阿里云多个产品出现了全球多可用区多产品的故障。通过Status Page不难发现,此次不仅是一个可用区的故障,可谓全球大故障。

据悉,阿里云此次确认的故障与某底层服务组件有关,有业内人士对记者分析称,这一服务组件或是阿里云的鉴权服务(Auth),云计算最基础的要求之一就是权限控制、资源隔离,这些是基于鉴权服务来实现的。

“通俗来讲,鉴权服务的工作原理就是给资源上一把锁,给资源使用者分配对应的钥匙。鉴权服务正常工作时,正确的钥匙可以打开对应的锁;出故障时正确的钥匙就不起作用了。”其表示。

此番并非阿里云第一次大面积故障。去年阿里云香港机房节点发生故障,多个网站、互联网应用均无法打开。“这次阿里云的崩溃,让大家真正意识到,‘一切都在云上’,云已经成为和水电一样的基础设施。而行业的危机事件,也让大家意识到多云备份已经迫在眉睫。”前述业内人士称。

多云融合成趋势

如何规避这种问题的发生?财联社记者与多位行业人士交流获悉,通过多云部署策略确保业务连续性、避免因单独一家云厂商事故而影响企业自身业务,已成为一大行业趋势。

一位云计算从业者告诉财联社记者,如果企业关键业务构建于单一云厂商之上,一旦出现重大故障,企业业务也会跟着停摆,更严重的是业务核心数据受到损坏。

其表示,如果是单云部署,即便在云内做各种各样的高可用,比如多倍冗余、跨可用区部署,但如果发生底层组件故障,那也会像阿里云这样出现多可用区的多产品故障。如果是多云部署,比如把业务部署在两个不同云厂商,两个云之间的组件不会相互依赖,就可以避免其中一个云出现问题时,整个产品都不可访问的现象。

行业人士向记者举例,作业帮、TT语音等企业已经选择了多云路线,而TiDB、OceanBase等新型数据库已支持多云部署。另据媒体报道,跨境电商SHEIN在海外市场同时使用亚马逊云、微软云等厂商服务。美国调研公司Kentik数据显示,有40%的受访企业至少使用两种云。

“国内短视频领域某大厂也在2017年开始实践多云架构方案,2021年管理的总机器数已经达到数十万规模。”前述业内人士透露。

“多云”策略是否会增加管理成本和技术成本?上述人士分析认为,“云计算相关的所有业务,说到底就是数据+计算,这其中数据的多云部署是最大的挑战,计算则相对容易一些。从实际案例来看,多云部署成本提升不算太高,这也和每个企业选择的技术方案有关:比如,如果只选择把关键模块做多云部署,那这部分产生的成本则很小。企业可以根据场景调用不同的云上产品和服务,例如用A云厂商的数据库服务,接入B云厂商的AI大模型,通过统一调度灵活调配。在完成前期的操作与数据管理后,相比稳定性提升的收益,对于大部分企业来说,这部分成本也是可以接受、并且愿意接受的。”

编辑/范辉

相关阅读
拿到手机就能支付 数字人民币组件化服务率先嵌入鸿蒙系统
北京青年报客户端 2024-10-23
OceanBase:OB Cloud支持海内外主流公有云厂商
北京青年报客户端 2024-09-27
新闻分析丨大规模宕机为全球信息技术安全敲响警钟
新华社 2024-07-21
有望打败闭源模型?阿里、百度、腾讯云厂商抢食开源Llama 3算力
第一财经 2024-04-23
持续近87分钟1957个客户报障 腾讯云回应事故原因
第一财经 2024-04-14
互联网App连串崩溃背后:小规模“崩了修好”常发生
​第一财经 2023-12-07
多家厂商纷纷“以价换量” 云计算市场新一轮“价格战”来袭
经济参考报 2023-05-18
火山引擎抢滩AI风口 大模型训练云平台胜算几何?
证券日报 2023-04-20
最新评论