2024年6月7日发(作者:)
Cluster集群
[编辑本段]
Cluster 簇
文件占用磁盘空间,基本单位不是字节而是簇。一般情况下,软
盘每簇是1个扇区,硬盘每簇的扇区数与硬盘的总容量大小有关,可
能是4、8、16、32、64……同一个文件的数据并不一定完整地存放在
磁盘的一个连续的区域内,而往往会分成若干段,像一条链子一样存
放。这种存储方式称为文件的链式存储。由于硬盘上保存着段与段之
间的连接信息(即FAT),操作系统在读取文件时,总是能够准确地
找到各段的位置并正确读出。为了实现文件的链式存储,硬盘上必须
准确地记录哪些簇已经被文件占用,还必须为每个已经占用的簇指明
存储后继内容的下一个簇的簇号。对一个文件的最后一簇,则要指明
本簇无后继簇。这些都是由FAT表来保存的,表中有很多表项,每项
记录一个簇的信息。由于FAT对于文件管理的重要性,所以为了安全
起见,FAT有一个备份,即在原FAT的后面再建一个同样的FAT。初形
成的FAT中所有项都标明为“未占用”,但如果磁盘有局部损坏,那
么格式化程序会检测出损坏的簇,在相应的项中标为“坏簇”,以后
存文件时就不会再使用这个簇了。FAT的项数与硬盘上的总簇数相当,
每一项占用的字节数也要与总簇数相适应,因为其中需要存放簇号。
[编辑本段]
Cluster 集群
一个计算机集群是指一组连接起来的电脑,它们共同工作对外界
来说就像一个电脑一样。集群一般由局域网连接,但也有例外。集群
一般用于单个电脑无法完成的高性能计算,拥有较高的性价比。
baidu和google的后台服务器就是一个cluster
Cluster技术发展多年了,但其实并没有一个非常准确的定义和分
类,不同的人有不同的理解。
其实,叫什么无所谓,只要能够对用户有益就可以了. :-)
就个人理解而言,cluster有以下几种,当然前面说过,不同的人
有不同的理解,大家可以充分讨论。我的这些分类更偏重于工程而不
是技术性。
HA集群
实现高可用性,但对单个应用性能没有提高,市场上大部分产品
都是属于这类,技术上也较简单。
IP负载均衡集群
利用IP技术实现对通用IP应用的支持。这种技术并不是很新,最
早是在硬件上面采用的,Linux出现后才有了很多纯软件的模式,这也
是open source带来的好处吧
并行计算集群
包括了一些象PVM,beowulf这样的信息传递机制和API库,也有
任务调度产品,当然技术上最难的是并行编译/并行系统等更智能化的
产品
应用负载均衡集群
虽然cluster的最高目的是实现真正的与应用程序无关的动态负载
均衡,但由于技术上的限制,现在都只能在特殊的应用中实现,需要
修改应用程序,所以并没有通用产品,大多是厂商有自己的并行版本。
例如oracle paraller serve r.
以上基本是按照工程或者说产品的角度划分的,和技术上划分应
该有一定区别。
[编辑本段]
媒体宣传稿
下面是一篇很早以前写的东西,当时是为了媒体宣传写的,有一
些商业味道在里面,有些地方技术上也不完全正确。现在给大家附上
是想交换一下观点。并不是宣传Turbolinux公司的产品(本人是
Turbolinux员工),确实是实在懒得改了,虽然这种商业性文章在公
共社区里发表犯了大忌。只是供大家参考,关于Turbolinux产品优劣
不参与讨论。请大家理解。
一直是不参与linux社区讨论的,这次是因为对cluster接触了比
较长的时间,已经有了很大的兴趣,所以注册了来灌水。


发布评论