2024年3月29日发(作者:)

淘宝技术框架分析汇报

淘宝作为国内首屈一指的大型电子商务网站,每天承载近30亿

PV的点击量,拥有近50PB的海量数据,那么淘宝是怎样保证其网站

的高可用的呢?本文将对淘宝在构建大型网站过程中所使用到的技

术框架做一种总结,并结合吉林银行既有技术框架进行对比分析。此

外,本文还会针对金融互联网以及企业未来技术发展方向给出个人见

解。

淘宝技术分析

CDN技术及多数据中心方略

国内的网络由于运行商不一样(分为电信、联通、移动),导致

不一样运行商网络之间的互访存在性能问题。为了处理这个问题,淘

宝在全国各地建立了上百个CDN节点,当顾客访问淘宝网站时,浏

览器首先会访问DNS服务器,通过DNS解析域名,根据顾客的IP将

访问分派到不一样的入口。假如客户的IP属于电信运行商,那么就

会被分派到同样是电信的CDN节点,并且保证访问的(这里重要指

JS、CSS、图片等静态资源)CDN节点是离顾客近来的。这样就将巨

大的访问量分散到全国各地。此外,面对如此巨大的业务祈求,任何

一种单独的数据中心都是无法承受的,因此淘宝在全国各重要都市都

建立了数据中心,这些数据中心不仅保证了容灾,并且各个数据中心

都在提供服务。不管是CDN技术还是多种数据中心,都波及到复杂

的数据同步,淘宝很好的处理了这个问题。吉林银行目前正在筹建两

地三中心,但重要目的是为了容灾,数据中心的运用率差,而淘宝的

多种数据中心运用率为100%。

LVS技术

淘宝的负载均衡系统采用了LVS技术,该技术目前由淘宝的章文

嵩博士负责。该技术可以提供良好的可伸缩性、可靠性以及可管理型。

只是这种负载均衡系统的构建是在Linux操作系统上,其他操作系统

不行,并且需要重新编译Linux操作系统内核,对系统内核的理解规

定很高,是一种软负载均衡技术。而吉林银行则通过F5来实现负载

均衡,这是一种硬负载均衡技术。

Session框架

Session对于Web应用是至关重要的,重要是用来保留顾客的状

态信息。不过在集群环境下需要处理Session共享的问题。目前处理

这个问题一般有三种方式,第一种是通过负载均衡设备实现会话保持,