Cluster集群编程频道|福州电脑网

2024年6月7日发(作者：)

Cluster集群

[编辑本段]

Cluster 簇

文件占用磁盘空间，基本单位不是字节而是簇。一般情况下，软

盘每簇是1个扇区，硬盘每簇的扇区数与硬盘的总容量大小有关，可

能是4、8、16、32、64……同一个文件的数据并不一定完整地存放在

磁盘的一个连续的区域内，而往往会分成若干段，像一条链子一样存

放。这种存储方式称为文件的链式存储。由于硬盘上保存着段与段之

间的连接信息（即FAT），操作系统在读取文件时，总是能够准确地

找到各段的位置并正确读出。为了实现文件的链式存储，硬盘上必须

准确地记录哪些簇已经被文件占用，还必须为每个已经占用的簇指明

存储后继内容的下一个簇的簇号。对一个文件的最后一簇，则要指明

本簇无后继簇。这些都是由FAT表来保存的，表中有很多表项，每项

记录一个簇的信息。由于FAT对于文件管理的重要性，所以为了安全

起见，FAT有一个备份，即在原FAT的后面再建一个同样的FAT。初形

成的FAT中所有项都标明为“未占用”，但如果磁盘有局部损坏，那

么格式化程序会检测出损坏的簇，在相应的项中标为“坏簇”，以后

存文件时就不会再使用这个簇了。FAT的项数与硬盘上的总簇数相当，

每一项占用的字节数也要与总簇数相适应，因为其中需要存放簇号。

[编辑本段]

Cluster 集群

一个计算机集群是指一组连接起来的电脑，它们共同工作对外界

来说就像一个电脑一样。集群一般由局域网连接，但也有例外。集群

一般用于单个电脑无法完成的高性能计算，拥有较高的性价比。

baidu和google的后台服务器就是一个cluster

Cluster技术发展多年了，但其实并没有一个非常准确的定义和分

类，不同的人有不同的理解。

其实，叫什么无所谓，只要能够对用户有益就可以了. :-)

就个人理解而言，cluster有以下几种，当然前面说过，不同的人

有不同的理解，大家可以充分讨论。我的这些分类更偏重于工程而不

是技术性。

HA集群

实现高可用性，但对单个应用性能没有提高，市场上大部分产品

都是属于这类，技术上也较简单。

IP负载均衡集群

利用IP技术实现对通用IP应用的支持。这种技术并不是很新，最

早是在硬件上面采用的，Linux出现后才有了很多纯软件的模式，这也

是open source带来的好处吧

并行计算集群

包括了一些象PVM,beowulf这样的信息传递机制和API库，也有

任务调度产品，当然技术上最难的是并行编译/并行系统等更智能化的

产品

应用负载均衡集群

虽然cluster的最高目的是实现真正的与应用程序无关的动态负载

均衡，但由于技术上的限制，现在都只能在特殊的应用中实现，需要

修改应用程序，所以并没有通用产品，大多是厂商有自己的并行版本。

例如oracle paraller serve r.

以上基本是按照工程或者说产品的角度划分的，和技术上划分应

该有一定区别。

[编辑本段]

媒体宣传稿

下面是一篇很早以前写的东西，当时是为了媒体宣传写的，有一

些商业味道在里面，有些地方技术上也不完全正确。现在给大家附上

是想交换一下观点。并不是宣传Turbolinux公司的产品（本人是

Turbolinux员工），确实是实在懒得改了，虽然这种商业性文章在公

共社区里发表犯了大忌。只是供大家参考，关于Turbolinux产品优劣

不参与讨论。请大家理解。

一直是不参与linux社区讨论的，这次是因为对cluster接触了比

较长的时间，已经有了很大的兴趣，所以注册了来灌水。

Cluster集群

发布评论取消回复

最近发表

相关推荐

标签列表

Cluster集群

发布评论 取消回复

最近发表

相关推荐

标签列表

发布评论取消回复