赞
踩
这篇论文谷歌公司2010年发表的,这是业内实现链路跟踪的理论基础,有很大的参考价值,作为一个技术人员,不应该仅仅满足于会用别人开发的链路追踪组件,应该读一下重要的论文,提升对工程技术的理解能力,理解工程设计背后的理论。
原文可以再网上搜,免费下载,读一下顺便可以锻炼英文阅读能力。
这篇论文主要经dapper是如何设计的,dapper是一个在Google生产环境下应用的分布式系统追踪服务。需要追踪的场景对dapper有两个基本的要求
针对这两个基本要求,提出了三个具体的设计目标:
分布式跟踪系统需要跟踪每一台机器上信息发送和接收的信息标识符合时间戳。
Dapper跟踪模型使用了数,span和标注。
在Dapper跟踪树中,一个树节点就是一个span,节点之间的连线表示span和span之间的关系,一个span是一个时间戳日志,里面包含有这个span的开始时间,结束时间,rpc时间上数据。dapper给每一个span都记录一个span name ,span id , parent id,这样就可以记录一个跟踪过程中不同span之间的关系。如果一个span没有parent id,说明他是根节点span。在一个请求过程中,产生的所有span共享同一个trace id。
Dapper允许开发者定义带时间戳的标注,这样可以丰富跟踪数据,方便调试。除了支持简单的文本标注,还支持key-value map 的标注。
为了降低测量的损耗,只记录一部分跟踪信息,通过采样来获取。
dapper的跟踪和收集分为三个阶段
BigTable中的每一个行表示一个跟踪过程,每一列是一个span,表示一次rpc调用的信息。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。