论文阅读----Ten Lessons From Three Generations Shaped Google’s TPU V4i
1, 论文常见缩写
1) Domain Specific Architecture (DSA)
2) A custom chip-to-chip interconnect fabric (ICI)
3) P99 latency:
P99延迟: 一段时间内,所有请求中最快的 99%请求的平均延时,能直观的衡量服务器性能指标.
同理 P95就是快的95%的请求延时.
4) SLA/SLO/SLI
SLA = Service Level Agreement = 服务质量 / 水平协议
SLO = Service-level-objective = 服务质量 / 水平目标
SLI = Service Level Indicator = 服务质量 / 水平指标
5) ISA(Instruction set architecture)
6) MLPerf benchmarks 0.5-0.7 :
- MLPerf Training benchmarks 0.5-0.7 :
- MLPerf Inference benchmarks 0.5-0.7
7) High BandWIdth Memory(HBM)
8) Itanium’s VLIW architecture: Very Long Instruction Word:超长指令集架构
安腾 (英语: Itanium ),是 (通常称之为 IA-64 )的64位处理器,该处理器的市场定位是在于 与 系统。该架构由惠普创始,后来则是惠普与英特尔共同开发。
安腾的微架构是彻底的不同于其他英特尔处理器采用的


发布评论