2024年6月7日发(作者:)

Cluster集群

[编辑本段]

Cluster 簇

文件占用磁盘空间,基本单位不是字节而是簇。一般情况下,软

盘每簇是1个扇区,硬盘每簇的扇区数与硬盘的总容量大小有关,可

能是4、8、16、32、64……同一个文件的数据并不一定完整地存放在

磁盘的一个连续的区域内,而往往会分成若干段,像一条链子一样存

放。这种存储方式称为文件的链式存储。由于硬盘上保存着段与段之

间的连接信息(即FAT),操作系统在读取文件时,总是能够准确地

找到各段的位置并正确读出。为了实现文件的链式存储,硬盘上必须

准确地记录哪些簇已经被文件占用,还必须为每个已经占用的簇指明

存储后继内容的下一个簇的簇号。对一个文件的最后一簇,则要指明

本簇无后继簇。这些都是由FAT表来保存的,表中有很多表项,每项

记录一个簇的信息。由于FAT对于文件管理的重要性,所以为了安全

起见,FAT有一个备份,即在原FAT的后面再建一个同样的FAT。初形

成的FAT中所有项都标明为“未占用”,但如果磁盘有局部损坏,那

么格式化程序会检测出损坏的簇,在相应的项中标为“坏簇”,以后

存文件时就不会再使用这个簇了。FAT的项数与硬盘上的总簇数相当,

每一项占用的字节数也要与总簇数相适应,因为其中需要存放簇号。

[编辑本段]

Cluster 集群

一个计算机集群是指一组连接起来的电脑,它们共同工作对外界

来说就像一个电脑一样。集群一般由局域网连接,但也有例外。集群

一般用于单个电脑无法完成的高性能计算,拥有较高的性价比。

baidu和google的后台服务器就是一个cluster

Cluster技术发展多年了,但其实并没有一个非常准确的定义和分

类,不同的人有不同的理解。

其实,叫什么无所谓,只要能够对用户有益就可以了. :-)

就个人理解而言,cluster有以下几种,当然前面说过,不同的人

有不同的理解,大家可以充分讨论。我的这些分类更偏重于工程而不

是技术性。

HA集群

实现高可用性,但对单个应用性能没有提高,市场上大部分产品

都是属于这类,技术上也较简单。

IP负载均衡集群

利用IP技术实现对通用IP应用的支持。这种技术并不是很新,最

早是在硬件上面采用的,Linux出现后才有了很多纯软件的模式,这也

是open source带来的好处吧

并行计算集群

包括了一些象PVM,beowulf这样的信息传递机制和API库,也有

任务调度产品,当然技术上最难的是并行编译/并行系统等更智能化的

产品

应用负载均衡集群

虽然cluster的最高目的是实现真正的与应用程序无关的动态负载

均衡,但由于技术上的限制,现在都只能在特殊的应用中实现,需要

修改应用程序,所以并没有通用产品,大多是厂商有自己的并行版本。

例如oracle paraller serve r.

以上基本是按照工程或者说产品的角度划分的,和技术上划分应

该有一定区别。

[编辑本段]

媒体宣传稿

下面是一篇很早以前写的东西,当时是为了媒体宣传写的,有一

些商业味道在里面,有些地方技术上也不完全正确。现在给大家附上

是想交换一下观点。并不是宣传Turbolinux公司的产品(本人是

Turbolinux员工),确实是实在懒得改了,虽然这种商业性文章在公

共社区里发表犯了大忌。只是供大家参考,关于Turbolinux产品优劣

不参与讨论。请大家理解。

一直是不参与linux社区讨论的,这次是因为对cluster接触了比

较长的时间,已经有了很大的兴趣,所以注册了来灌水。