2023年11月27日发(作者:)

行在英特尔至强处理器上的Microsoft SQL Server 2008 R2 Parallel Data

WarehouseFast Track Data Warehouse

简介

要制定更出色的决策、提高运营效率、建立高盈利能力客户关系、开发差异化产品、最大化

企业绩效、加强竞争优势,企业员工需要完整、最新的信息,而实现对这些信息的快速访问,

数据仓库显得至关重要。数据仓库的商业智能 (BI) 解决方案的利用越有效、越广泛,这些

解决方案所能提供的优势也就越明显。

许多企业发现,数据仓库的成本和复杂性极具挑战性。因此,他们建立了一些较小的分析数

据存储(而非数据集市)并依赖于它们,重点关注企业特定部分的特定业务职能。在短期内,

这或许是一种有效的解决方案,但随着时间推移,其诸多缺陷就会凸显出来:

没有可靠的企业数据来源 - 仅仅是一组数据集市。

在新的数据需求出现时,必须重新构建各数据集市。

数据集市较为脆弱,在基本需求变化时,需要推倒重建。

企业一旦采用了多个数据集市的方法,通常就无法找到轻松、合理的路径向以数据仓库

为中心的环境进行迁移。

微软和英特尔如今准备帮助企业在数据仓库领域迈上新的台阶。利用 Microsoft® SQL

Server® 2008 R2 Enterprise,如今您可以使用 Microsoft Fast Track Data Warehouse

项快速部署小型数据仓库或数据集市,它为数据集市和数据仓库提供了一组全新的可扩展的

参考架构,可提供类似设备的体验。此后,随着数据增加到上千 TB,全面扩展数据仓库的

需求出现,这些数据集市或仓库成为使用 Microsoft® SQL Server® 2008 R2 Parallel

Data Warehouse (领先技术厂商为企业数据仓库提供的高度可扩展设备)的外扩解决方案

的一部分。凭借这些解决方案,微软已经解决了此类转换中某些最难应付的方面,包括自动

同步数据仓库内集中管理的数据与数据集市内的数据。

英特尔在这些解决方案中起到至关重要的作用,使之能够在基于英特尔® 至强® E7-8800

/4800 /2800 系列处理器和英特尔® 至强® 5600/5500 系列处理器的平台上以较低的每TB

价格 提供卓越的性能。例如 ,在 TPC Benchmark* E (一种通用数据库基准测试)中,以

英特尔® 至强® E7-4800 例,其性能与上一代英特尔® 至强® x7560 处理器相

比提升了 22%,与上一代英特尔® 至强® x7460 处理器相比则提升了 245%。而收益还不止

于此。微软、英特尔和多家技术厂商合作伙伴相互协 作, 决了 获得 BI

决方案的所有潜在性能优势的众多数据瓶颈。

对于更好的数据仓库解决方案的需求

过去,企业采用集中或分散的方法来满足数据仓库需求。这两种方法均存在严重缺陷。集中

式企业数据仓库 (EDW) 成本高昂,灵活性差,无法在合理的成本和时间内满足业务需求,

因此令业务部门倍受挫折。另一方面,分散式数据集市尽管能够更好地响应业务部门的需求,

但往往会导致相同数据存在多个版本。因此难以在企业内保持数据一致性。

无论是整体的还是杂乱分布的,这些传统BI解决方案都倾向于将组织锁定在对专有架构的

大量投资中,造成基础架构成本的急剧攀升。有时,性能降级、存储空间不足、业务实践变

、降低IT碳排放量的要求、用户增加,这些因素或几个因素的组合也往往会带来大规模

系统升级的需求。以往这些经验使许多企业想要寻找一种具有更好的可扩展性和更高敏捷

性的EDW 环境。

对于某些企业来说,中枢星型架构(有时也称之为“联邦”EDW)是最完美的折衷方案。它

提供了一个集中式 EDW 和一组独立数据集市,与多数大型企业的业务结构相符合。中枢

允许将企业作为一个整体,实施通用标准,同时跨业务部门实现分析和报告。数据集市星型

结构允许业务部门以相对较低的成本迅速满足自己的需求,同时符合整个企业的 IT 需求。

遗憾的是,迄今为止,中枢星型系统的实施仍然极为困难。

完善数据仓库的设备模型

实现中枢星型架构的一种更为简单的方法就是利用数据仓库设备。数据仓库设备是将所有必

要的硬件和软件打包到一个预先配置的解决方案中,这个方案可显著简化数据仓库的运行和

管理。一种更好的想法是在行业标准的硬件平台上构建数据仓库设备。

Microsoft® SQL Server® 2008 R2 Parallel Data Warehouse

SQL Server® 2008 R2 Parallel Data Warehouse 是基于行业标准硬件平台的先进设备的示例。

这种具有高可扩展性的 EDW 设备是最初由 DATAl legro 创建的数据仓库设备的新一代发

展成果 。它 (MPP)SQL Server 2008 Windows Server®

2008 R2 和行业标准硬件上提供高性能和可扩展性。与其他 EDW 解决方案相比,MPP

构支持更出色的可扩展性(外扩而非上扩)更高和更加可预测的性能和更低的每 TB 成本。

利用 SQL Server® 2008 R2 Parallel Data Warehouse,您 数据仓库从数十 TB 扩展到数

TB。除 外,MPP的使用消除了 CPU、内存和存储给速度和扩展带来的物理局限

性,而这也正是许多采用对称多处理 (SMP) 架构的 EDW 解决方案所面临的问题。查询处

理在一个数据库的物理实例内便可全部完成。不存在资源争用现象。

微软的设备模型实现是与各硬件供应商合作完成的,采用专为串行 I/O 而调优和优化的基

于英特尔至强处理器的平台。所有组件均彼此均衡,以减少潜在性能瓶颈(从存储区域网络

(即 SAN)到 核)。同 是,所 和存储组件均

进行了镜像,实现了企业级冗余备份。为了实现在 MPP 架构上的性能最大化,采用一个控

制节点,该控制节点将应用发来的查询请求,分发到所有的计算节点,并收集返回查询结果。

MPP 架构的一项关键优势就是能够利用多个并发资源,针对分布式数据解决SQL Server

设置操作。各实例并行工作,分别处理自己的单一用户查询。SQL Server® 2008 R2 Parallel Data

Warehouse在每个数据机架中支持多达10SQL Server DBMS的并行实例。四机架系统最多

可支 40个实例。借助MPP架构,SQL Server® 2008 R2 Parallel Data Warehouse 消除了各

用户查询的争用,“完全不共享”的设计中为各查询专门分配一组完整的资源,从而快速

提供可预测的查询结果。资源和数据的独立性在各数据库管理系统 (DBMS) 实例中得到维

护。由于数据跨多个节点平均分布,处理操作是并行执行的,因而查询的处理速度可能比单

SMP 数据库服务器快数倍。此外,随着数据量的增加,仅需添加额外的设备即可实现向

上扩展。您可以持续外扩,通过增加机箱/实例来添加新资源。随着更多节点的添加,系统性

能将线性提升。

SQL Server® 2008 R2 Parallel Data Warehouse支持第三方BI解决方案,并提供了与 Microsoft

BI 产品的无缝集成,这些产品包括:

Microsoft Office and Microsoft PowerPivot for Excel ®

Microsoft® SQL Server® 2008 分析服务

Microsoft® SQL Server® 2008 报表服务

Microsoft® SQL Server® 2008 集成服务

Microsoft® SharePoint® Server 2010

更好的中枢星型架构的基础

SQL Server® 2008 R2 Parallel Data Warehouse 革新了中枢星型解决方案,使之不仅包含MPP

设备,还包括SQL Server® 2008SMP实例和SQL Server分析服务。这使得重新部署现有

SMP数据集市并将其作为节点插入MPP 集群、从MPP 中枢接收数据成为可能。SMP 数据

集市被视为网格内的节点。通过这样一个高度灵活、成本相对低廉且可伸缩的平台,首次使

大规模的中枢星型 EDW 架构成为可能。企业可以通过分散式数据集市所提供的敏捷性实现

集中管控。

SQL Server Fast Track Data Warehouse

为了帮助企业加快数据仓库建设,微软提供了 SQL Server Fast Track Data Warehouse该解决

方案针对数据仓库提供了一系列参考架构及最佳实践,用户在选择SQL Server来实现BI

决方案时,无需为如何选择相关硬件及相关基础架构而困惑,从而大大提高了数据仓库的部

署及迁移速度。企业可以选择最适合其业务需求的合理性能、可伸缩性和价格。独立数据集

市可利用 SQL Server® 2008 R2 企业版中的压缩功能,从4 TB扩展到48 TB。类似于SQL

Server® 2008 R2 Parallel Data WarehouseSQL Server Fast Track Data Warehouse旨在为各

DBMS 实例提供资源和数据独立性。由于数据跨多个节点平均分布,因此查询速度比单一

SMP 数据库服务器上的速度快数倍。

SQL Server Fast Track Data Warehouse 使企业能够部署高性能的企业级数据仓库,且无需承担

传统系统的高昂成本或耗时的硬件测试和调优。预先配置的服务器、存储和网络均采用行业

标准硬件,并专门针对数据仓库进行过优化,因此可提供更出色的“开箱即用”性能。使用

Microsoft Fast Track Data Warehouse 参考架构构建数据仓库的企业可轻松将其整合为并行

数据仓库中枢星型系统中的节点。这使您能够在并行数据仓库中枢内维护企业数据,并按照

需要将数据发布到数据集 市,从而支持部门级应用。

基于英特尔® 至强® 处理器的平台的最佳性能

对于 SQL Server® 2008 R2 Parallel Data Warehouse 设备和 SQL Server Fast Track Data

Warehouse 参考架构,微软指定了英特尔® 至强® E7-8800/4800/2800 系列处理器和英特尔®

至强® 5600/5500 系列处理器作为运算平台。这些处理器以较低的每 TB 价格提供了卓越的

性能以及高端的系统级功能——例如独立的CPU、内存、可伸缩的 I/O 和硬分区,无论是

采用单独物理实例处理查询还是跨多个物理节点对大型数据表进行分区,这些功能都可以提

供一套平衡的平台。英特尔® 至强® 处理器改变了处理器的工作方式以及与系统内存和其他

服务器组件的交互方式。因此,对于非共享的并行架构且各节点均有专用 CPU

储来运行SQL Server服务器实例的并行环境而言,这些处理器是理想选择。

通过英特尔® 至强® E7-8800/4800/2800 系列处理器支持 SQL Server® 2008 R2 Parallel

Data Warehouse

基于英特尔® 至强® E7-8800/4800/2800 系列处理器的最新服务器将性价比提升到新高度,

BI 解决方案提供了更为出色的功能。英特尔® 至强® 系列处理器的每一代更新都会使服

务器的性能获得显著提升。英特尔® 至强® 7500 系列处理器在超过 25 种企业和技术计算

基准测试3中所创造的世界纪录表明,这些服务器比上一代服务器提供的数据库性能高出

40% SQL Server® 2008 R2 Parallel Data Warehouse 英特®®

E7-8800/4800/2800 系列处理器提供了革命性的新价值,仅需很少的成本,即可帮助它们挑

UNIX*/RISC

英特尔®至强® E7-8800/4800/2800系列处理器支持具有248 路服务器设计,无需自定义

OEM ®®

E7-8800/4800/2800 系列处理器具有10 内核和 30 MB 缓存,是并行数据仓库应用程序的

理想选择。凭借 80 个高性能处理器核心、160 个执行线程和2 TB 内存,8 路系统可为重

负工作负载提供充足的资源。

英特尔® 至强® E7-8800/4800/2800 系列处理器同时增加了每路资源和整体系统可扩展性,

这使之成为 SQL Server® 2008 R2 Parallel Data Warehouse 设备的完美选择。

数量更多、性能更高的内核 基于最新的高性能微架构,每个处理器可提供多达八个

内核(而非四个)。每个内核都支持英特尔®超线程技术†(英特尔® HT 技术 ,因此可同时

处理两个软件线程。这为SQL Server等多线程应用程序提供了更高效的处理。

内存带宽提升八倍。英特尔® 快速通道互联技术和集成内存控制器加速了处理器与其他

组件之间的流量,从而降低了延迟、优化了系统带宽的使用,为带宽密集型的 SQL Server®

2008 数据仓库、BI和其他 Windows 应用程序交付了更出色的应用程序响应能力和更高的

每处理器吞吐量。凭借两个集成内存控制器和每个控制器的两个英特尔® 可扩展内存互联链

路,每个插槽均可支持达 50 GB/s4的大型数据集快速访问。各处理器还提供了30 MB

存,因此大量频繁使用的数据可按照与时钟速度相同或接近时钟速度的速度访问,

现更加高速的处理。非统一内存访问 (NUMA) 支持为要求严格、内存密集的应用程序提供

突破性的性能。

四倍内存容量。每个插槽均可利用通过英特尔® 可扩展内存缓冲器(英特尔Scalable

Memory Buffers连接的标准DDR3 内存组件支持1632 GB DIMMS这种内存容量的大幅

增加使之成为托管大型数据库和其他数据密集型应用程序的理想选择。

通过优化吞吐量与总耗能的比例,英特尔至强处理器有助于为要求严格的数据库应用程序降

低能耗,并提高性价比。其中包含多种技术,可智能适应工作负载,从而确保性能和能效始

终保持动态优化。

英特尔® 睿频加速技术在散热允许的情况下,可为较大的工作负载自动将核心频率提升

到额定值以上。这使 SQL Server 2008® R2 Parallel Data Warehouse 设备可在必要时为某些查

询提供巅峰性能,而且不会增加负载较低的工作负载的能耗。

英特尔® 智能节能技术 可根据工作负载需求调整能源消耗,自动切换到不影响性能的最

低耗能状态。能源管理任务允许操作系统以及“可用硬件”在性能和所用资源之间达到平衡。

除了这些令人振奋的性能、可扩展性和能效优势之外,英特尔® 至强 ® E7-8800/4800/2800

系列处理器还有其他许多优点。 20 种面向大型机的可靠性、可用性和可服务性 (RAS)

特性有助于提供诸多收益。

良好的数据完整性。 跨所有重要组件和通信路径的错误检测、纠正和容错的高级支持。

更高的系统可用性。 多级冗余以及 OS 辅助的不可纠正错误的系统恢复,而对于上一

代的服务器来说,此类错误可能会导致服务器宕机。英特尔® 增强机器校验架构 (MCA)

复技术——通常可在高端 RISC 和基于安腾® 的系统中看到——使系统能够监测和纠正

CPU I/O 中的错误,并与操作系统协同工作,支持任务关键型系统需要交付的高

水平正常运行时间。

更高的可服务性。预测故障分析支持识别有问题的组件,并在发生故障前更换它。此外

还支持电气隔离的静态硬分区,以提供强大的工作负载隔离,并支持更高效的维护周期。

利用英特尔® 至强® 5600/5500 系列处理器实现企业级 SQL Server® 2008 Fast Track Data

Warehouse

Fast Track Data Warehouse 与典型联机事务处理 (OLTP) 数据库的不同之处在于所有组件

(从CPU到磁盘)均 机分析处理 (OLAP)而优化,并着重消除潜在的性能瓶颈。

由于为串行I/ O而非随机I/O 优化,因此每一个Fast Track Data Warehouse 都可能提供每

CPU 核心高达200 MB/s的性能。利用正确的处理器,您可以加快每一条查询的处理速度,

同时最大程度地降低能源成本。

英特尔® 至强® 5600 系列处理器已经逐渐成为企业的最佳选择。无论是规模较小的部门级

查询,还是并发性及复杂度更高的大规模查询,基于英特尔® 至强® 5600 系列处理器及Fast

Track 技术所配置的数据集市都能轻松应对,并专门针对超过10 TB的压缩存储进行了优化。

在您需要时提供电能,在您不需要时节约能耗

英特尔® 至强® 5600 系列处理器可自动管理能源消耗,根据应用程序需求智能调整服务器

性能,最大程度地降低能源成本和提高性能。这种令人惊讶的组合的秘密就在于英特尔 32

® 至强® 5600 系列处理器利用英特尔睿频加速技术,根据应用

程序需求智能地调整性能(在热量允许的情况下,为较大工作负载自动将核心频率提升到额

定值以上),并利用英特尔智能节能技术,自动将 CPU 和内存转入可行的最低功耗状态,

从而降低能源成本。实际上,英特尔® 至强® 5600 系列处理器提供了与上一代服务器相的

性能,但占用的功率低 30%。可使用6个核心的英特尔® 至强® 5600 系列处理器通过英特

尔超线程技术提供了多达12个处理线程,从而进一步最大程度地提供性能和效率。

通过内存和数据带宽最大限度地提升性能

为了给带宽需求较高的应用程序(如 DBMS)提供完美的性能,英特尔® 至强® 5600 系列

处理器采用了英特尔快速通道互联技术。每个处理器都有自己的专用内存,可直接通过集成

化内存控制器进行访问它们。在英特尔® 至强® 5600 系列处理器中,这种可扩展、共享的

内存架构提供了领先的内存带宽,带宽可达到上一代处理器的 4.4 倍,还

间以及处理器和 I/O 集线器之间提供了高速(高 25.6 GB/s)的点到点连接。这提供了

保持各核心最大限度地运行所需的带宽。

确保安全性的同时降低性能成本

为了更快地处理加密数据,英特尔® 至强® 5600 系列处理器包含可供AES 算法使用的七条

指令Advanced Encryption Standard-New Instructions AES-NI与过去的AES 进程相比,

这种指令集可提供3倍的加密和解密速率。一种称为 PCLMULQDQ 的指令将执行用于加密

的无进位乘法。这些指令允许处理器执行硬件加速加密,不仅可带来更快的执行速度,还可

防止以软件为目标的攻击。

其他可选处理器

对于规模较小的 Fast Track Data Warehouse 序,用 户可以选择英特尔® 至强®

5500 系列处理器配合微软可扩展参考架构来构建平台。该平台可以利用英特尔® 至强®

5600 系列处理器所提供的诸多关键智能性能和能效优势,但采用的是性能较低的四核设计。

除此之外,采用英特尔® 至强® E7-8800/4800/2800 系列处理器及 Fast Track Data Warehouse

参考架构,可以针对企业特定部分对于数据仓库的苛刻需求而创建“超级”数据集市,从而

实现高效数据集市解决方案或扩展 SQL Server® 2008 R2 Parallel Data Warehouse 的节点。

总结

SQL Server® 2008 R2 Enterprise 支持企业使用 Microsoft Fast Track Data Warehouse 选项在行

业标准硬件上迅速部署小型数据仓库或数据集市。随着组织的数据增加到数百 TB,以及全

面扩展数据仓库的需求出现,这些数据集市(和现有 SMP 可能成为使用 SQL

Server® 2008 R2 Parallel DataWarehouse 的外扩解决方案的一部分。这些解决方案分别使用

英特尔® 至强® E7-8800/4800/2800 系列处理器和英特尔® 至强® 5600系列处理器实现最高

性能。这些处理器与微软数据仓库解决方案之间特有的协同合作为英特尔和微软平台提供了

领先优势,同时通过性能更高的平台使 IT 部门能够在每台服务器上支持更多应用程序和用

户,从而使业务能够继续保持增长,但又不会耗尽数据仓库容量。随着数据量的增长,仅需

为设备增加容量便可实现可扩展性。无需要求执行升级整个设备的“重大升级”。通过部署

这些平台,企业即可极大地减少部署数据仓库解决方案所需的工作量,实现更高的性价比、

提高业务敏捷性,同时借助更快更好的数据访问获得更佳的业务洞察力,使企业从中受益匪

浅。并行数据仓库设备包括领先硬件和软件供应商提供的业经细心考量的预装硬件。这种设

备模型能显著加速您创造价值的进程,并降低部署成本。通过精心平衡的配置、严格的规范

和测试、行业领先英特尔至强处理器的使用,并行数据仓库 MPP 设备设计用于交付可预测

的性能。微软参考配置适合多种不同使用场景,包括报告和即席查询。随着数据增长和业务

需求的变化,微软解决方案和基于英特尔的服务器可提供出色的选项,支持更多用户和不断

演进的业务需求。