2024年5月3日发(作者:)
BitTorrent协议分析文档
1 协议相关概念
1.1 简介
BitTorrent协议(简称BT,俗称比特洪流、BT下载)是一个网络文件传输协议,它能够
实现点对点文件分享的技术。比起其他点对点的协议,它更有多点对多点的特性,这个特点
简单的说就是:下载的人越多,速度越快。下载完不去马上关闭BitTorrent软件,就可以成
为种子(拥有完整的文件者)分享让其他人下载。
1.2 原理
普通的HTTP/FTP下载使用TCP/IP协议,BitTorrent协议是架构于TCP/IP协议之上的一
个P2P文件传输协议,处于TCP/IP结构的应用层。 BitTorrent协议本身也包含了很多具体
的内容协议和扩展协议,并在不断扩充中。
根据BitTorrent协议,文件发布者会根据要发布的文件生成提供一个.torrent文件,即种
子文件,也简称为“种子”。
.torrent文件本质上是文本文件,包含Tracker信息和文件信息两部分。Tracker信息主要
是BT下载中需要用到的Tracker服务器的地址和针对Tracker服务器的设置,文件信息是根
据对目标文件的计算生成的,计算结果根据BitTorrent协议内的B编码规则进行编码。它的
主要原理是需要把提供下载的文件虚拟分成大小相等的块,块大小必须为2k的整数次方(由
于是虚拟分块,硬盘上并不产生各个块文件),并把每个块的索引信息和Hash验证码写
入.torrent文件中;所以,.torrent文件就是被下载文件的“索引”。
下载者要下载文件内容,需要先得到相应的.torrent文件,然后使用BT客户端软件进行
下载。
下载时,BT客户端首先解析.torrent文件得到Tracker地址,然后连接Tracker服务器。
Tracker服务器回应下载者的请求, 提供下载者其他下载者(包括发布者)的IP。下载者再
连接其他下载者,根据.torrent文件,两者分别对方告知自己已经有的块,然后交换对方没有
的数 据。此时不需要其他服务器参与,分散了单个线路上的数据流量,因此减轻了服务器负
担。
下载者每得到一个块,需要算出下载块的Hash验证码与.torrent文件中的对比,如果一
样则说明块正确,不一样则需要重新下载这个块。这种规定是为了解决下载内容准确性的问
题。
一般的HTTP/FTP下载,发布文件仅在某个或某几个服务器,下载的人太多,服务器的
带宽很易不胜负荷,变得很慢。而BitTorrent协议下载的特点是,下载的人越多,提供的带
宽也越多,种子也会越来越多,下载速度就越快。
而有些人下载完成后关掉下载任务,提供较少量数据给其他用户,为尽量避免这种行为,
在非官方BitTorrent协议中存在超级种子(super seed)的算法。这种算法允许文件发布者分
几步发布文件,发布者不需要一次提供文件所有内容,而是慢慢开放的下载内容的比例,延
长下载时间。此时,速度快的人由于未下载完必须提供给他人数据,速度慢的人有更多机会
得到数据。
1.3 相关概念
Tracker:收集下载者信息的服务器,并将此信息提供给其他下载者,使下载者们相互连
接起来,传输数据。
种子:指一个下载任务中所有文件都被某下载者完整的下载,此时下载者成为一个种子。
发布者本身发布的文件就是原始种子。也指.torrent文件。
做种:发布者提供下载任务的全部内容的行为;下载者下载完成后继续提供给他人下载
的行为。
DHT网络:DHT全称为分布式哈希表(Distributed Hash Table),是一种分布式存储方法。
在不需要服务器的情况下,每个客户端负责一个小范围的路由,并负责存储一小部分数据,
从而实现整个DHT网络的寻址和存储。使用支持该技术的BT下载软件,用户无需连上
Tracker就可以下载,因为软件会在DHT网络中寻找下载同一文件的其他用户并与之通讯,
开始下载任务。有些软件(如比特精灵)还会自动通过DHT搜索种子资源,构成种子市场。
另外,这里使用的DHT算法叫Kademlia(在eMule中也有使用,称为KAD,具体实现协议
有所不同)。这种技术好处十分明显,就是大大减轻了Tracker的负担(甚至不需要)。用户
之间可以更快速建立通讯(特别是与Tracker连接不上的时候)。


发布评论