当前位置:   article > 正文

FastDFS原理及维护_fdfs

fdfs

FastDFS

fdfs是一个开源分布式存储解决方案,整个集群节点分为storage和tracker
  • storage真正的存储文件的节点,集群中可以有很多个storage节点,每个节点都是平级的,互为备份。
  • tracker负责协调和管理整个集群,集群中可以有多个tracker,它们都是平级的,为了提高系统的稳定性和吞吐量,建议部署多个tracker。
集群关系
  • 多个(M)tracker对应多个(N)storage,一般M<N,当然为了节约服务器资源,一台机器上可以既有tracker也有storage存在;
  • storage属于最基本的存储单元,每个storage隶属于一个group,每个group可以有很多storage,在同一个group的storage他们互为副本,存储的文件都是一样的;正因为它们互相备份,所以group的存储能力,取决于group里面的storage的最小存储能力。
  • 集群的存储能力由集群中group的数量决定,而group的存储能力是由storage的data目录的存储能力,也就是挂载的磁盘的大小决定,当然这个存储路径可以写多个,可以挂载多个磁盘,但是同一group的storage配置的data目录的路径数量必须一致,也就是不能有的配置了一个存储路径,有的配置了多个存储路径,由此看来,storage的存储能力进而也会影响着整个集群的存储能力。
  • 集群扩容,可以根据项目需求,增加group的数量或者增加storage的存储能力(磁盘扩容或者增加存储磁盘目录),前者相对较简单,后者相对比较难,需要为同group的每个storage扩容。
上传流程
  1. 客户端根据自己持有的tracker server地址,轮询向tracker发送上传请求,每个tracker都是一样的,tracker根据每个group的存储能力以及group内storage的上传策略,选择一个storage返回给客户端。
  2. 客户端直接和返回的storage建立连接上传文件,storage存储文件并返回文件的id,这个id其实是这个文件在这个服务器的存储路径。
  3. 服务器接收到文件的时候先对文件生成新的名字,生成策略会加入本机的IP地址、时间戳、文件大小等信息,然后得到一个字符串就是文件名,然后再把这个文件名按照一定的算法得到一级目录和二次目录,最后拼上刚才的文件名就是返回给客户端的id;可以看到上传后不会保存文件的原始名,所以想保存文件的原始名的话,最好和上传后得到的id一块保存,以便需要的时候做展示。
  4. 服务器在完成自己文件存储后,会向同group的其他storage同步刚才上传的文件。
下载流程
  1. 客户端拿着文件id去请求tracker要进行文件下载,tracker根据拿到的id解析出此文件被上传的原始storage,然后根据负载均衡策略和原始storage和其他节点的同步进度,返回一个合适的可以下载文件的节点。
  2. 客户端和返回的storage节点建立连接下载文件。
新storage节点加入
  1. storage启动后,向配置的tracker注册自己,然后向tracker询问自己从哪个机器同步数据。
  2. tracker收到请求后根据当前组内的机器状态分配一台ACTIVE的storage,加上当前的时间戳一块返回新加入节点;并且在本地记录该信息,同时将新机器状态设置成WAIT_SYNC。
  3. 新节点收到返回的源storage和时间戳,记录到data/.data_init_flag文件的sync_src_server和sync_until_timestamp两个字段,并且将sync_old_done字段更新成1,表示已完成获取源主机的操作。
  4. 由于其他的storage在不断的和tracker保持心跳,在心跳过程中得知新加入的节点以及对应的源storage节点、同步截至时间,然后检查自己是不是对应的源storage节点;
    - 如果不是,将信息写入到“新加入节点IP_端口号.mark”文件之中,其中need_sync_old=0,sync_old_done=0,util_timestamp = 源同步截止时间。然后等待新加入节点状态变更为ACTIVE,然后同步本机此时间戳以后的源文件,注意这个同步只同步此节点作为源的文件,也就是时间戳以后binglog文件中对应的大写操作符的文件。
    - 如果是的话,则将信息写入到“新加入节点IP_端口号.mark”文件之中,其中need_sync_old=1,sync_old_done=0,util_timestamp = 查询到的源同步截止时间,并请求tracker将新加入节点的状态设置成SYNING;然后启动一个线程从头开始读取binlog文件,同步时间戳之前的全部文件给新加入节点,同步过程中也会记录最后同步的binlog的offset,假如宕机了,下次启动后也可以根据offset继续进行同步。
  5. 当源节点同步完成的时候,请求Tracker将新加入节点状态设置成OFFLINE,此时源同步完成。
  6. 在下一个心跳中,tracker会将新加入节点状态设置成ACTIVE,此时新机器加入完毕。

取巧:如果新增副本节点B,可以先人工选择一节点A作为拷贝源,把A节点自身的data/sync目录下的同步时间比较相近(也就是偏移量最大)的mark文件复制一份为B_port.mark,同时把同group的其他storage的data/sync/A_port.mark文件复制一份为B_port.mark,然后把A节点的数据手动复制到B节点,然后启动B节点,最后让节点之间自动完成最近的增量同步,这样效率会比较高,因为节点间的单线程同步太慢。

新增加tracker

如果新增加一台tracker server,storage server连接该tracker server,发现该tracker server返回的本组storage server列表比本机记录的要少,就会将该tracker server上没有的storage server同步给该tracker server。

fdfs空间扩容

在集群创建初期,集群的存储能力肯定是有限的,那么随着业务的增长,fdfs的空闲空间肯定会越来越小,如果剩余空间小于磁盘的10%(默认)的话,就会导致上传异常(errno code:28)不能再继续往集群中上传文件,由于上传失败会导致大量的重试,最糟糕的情况就是大量的上传重试导致集群崩溃,此时本能正常提供读取文件的服务也会收到影响。如果说很不幸,你们的磁盘没有做 LVM的话,那么就不能在线扩容磁盘空间,所以能做的只有增加group数量或者同时增加group内的storage的数据存储目录Path,这样的话需要为每台机器新增加一块磁盘。

fdfs数据迁移
  • 如果迁移后,机器IP不变的话,那很好弄,就像关机开机一样简单。
  • 如果说迁移后IP发生了变化,默认安装,那么需要注意,tracker server上需要调整的文件data/storage_groups_new.dat
    data/storage_servers_new.dat
    data/storage_sync_timestamp.dat
    在数据复制到新机器后,需要在新机器storage上更改.data_init_flag文件,把sync_src_server置空。另外把属于同一group的其他storage的data/sync目录下对应的“迁移前IP_端口号.mark”这个文件改为“迁移后IP_端口号.mark”,然后重启迁移后的机器就可以了。
  • 如果IP变化,采用自定义server ID模式安装,那么只需要修改stroage_ids.conf文件(据说未验证)
fdfs的最早时间原则

假如group1下面有3个storage,一个文件F被上传到As,如果配置的下载策略是轮询的话,那么被轮询的s怎么确定已经同步到了F呢?
每个s会定期告知tracker,自己往其他节点上已经同步的文件时间戳,这个时间戳列表存在tracker的/data/storage_sync_timestamp.dat文件中。前面说了,从文件的Id可以解析出源s以及文件的上传的时间戳等信息,那么如果说往其中一个节点上同步的时间戳大于接续出来的时间戳,那么就可以肯定这个文件肯定在这个节点上,进而可以通过轮询负载服务器压力。

fdfs常见的文件说明(非配置文件)

data/.data_init_flag这个文件在s节点加入的时候创建;

storage_join_time=1000000000  #节点加入的时间
sync_old_done=1			      #表示已完成获取源主机的操作
sync_src_server=			 #已获取源主机IP
sync_until_timestamp=0			#源s同步此时间戳之前的全量文件
  • 1
  • 2
  • 3
  • 4

data/sync/IP_Port.mark

binlog_index=2   #已经同步到的binlog index
binlog_offset=986836772  #同步的偏移量
need_sync_old=1			#是否需要全量同步
sync_old_done=1			#是否已完成全量同步
until_timestamp=1483511493	#全量同步的截至时间
scan_row_count=53124322		#扫描多少行binglog
sync_row_count=9180742		#同步多少行binlog
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/345597
推荐阅读
相关标签
  

闽ICP备14008679号