2023年12月8日发(作者:)
半导体设备AMATP5000死机故障分析及处理
郭晶磊;顾吉
【摘 要】The semiconductor tools P5000 made by Applied Materials, the
famous semiconductor tools manufacturer in USA. This tools often occur
all sorts of screen lockup problems. Here, the author introduce how to find
the report of the screen lockup problems and analyse these reports, finally
find the exception numbers in these reports. The author decipher these
exception numbers and give the troubleshooting about the screen lockup
problems.%著名半导体设备厂商美国应用材料公司生产了半导体制程设备P5000,该设备在实际使用过程中经常出现各种类型的死机现象。文章重点介绍了通过查询P5000设备的死机报告界面,对该界面进行分析,找出其中最关键的死机代码,并对常见的的死机代码进行原因分析,找出相应的死机原因。针对不同的死机原因提出相对应的可行性解决方案,最终快速、正确地解决常见的死机问题。
【期刊名称】《电子与封装》
【年(卷),期】2012(012)005
【总页数】4页(P45-48)
【关键词】P5000;死机;代码;VME;接地
【作 者】郭晶磊;顾吉
【作者单位】中国电子科技集团公司第58研究所,江苏无锡214035;中国电子科技集团公司第58研究所,江苏无锡214035 【正文语种】中 文
【中图分类】TN305
1 引言
P5000设备由全球著名半导体设备厂商美国应用材料公司(Applied Materials)生产,P5000系统是世界上第一台成功的以单晶片、多反应室理念而设计的量产与研发均适用的半导体制程设备。P5000系统具有绝佳的制程整合、量产制造等优点,并在不破真空的状况下,最多有四个相同或不相同的制程反应室同时进行生产,更富有弹性和整合能力。反应原理为:材料源以气体形式进入工艺腔体内,在RF加功率的情况下,材料源(反应气体)从辉光放电(Plasma:等离子场)中获得激活能,激活并增强化学反应,从而实现化学气象淀积。在实际使用过程中,P5000平台经常会出现各种各样的死机现象,本文就针对具体的各种死机现象进行分析,并提供相关的解决方案。
2 死机代码查询方法
P5000系统软件能够自动保存最后一次死机信息,具体查看方法为:
(1)在主界面用光笔点击Service菜单,如图1;
(2)在Service下拉菜单中选择Diagnostics菜单,如图2;
(3)在Diagnostics下拉菜单中选择Last Exception Report菜单,如图3。
图1 死机代码查询界面1
图2 死机代码查询界面2
图3 死机代码查询界面3
图4 死机代码查询界面4
该死机信息同时被保存在文件中,从死机信息报告界面中我们可以得到相关信息,见图4和表1。
在表1所述信息中,最重要的是第4条(Exception number),根据该代码可以对死机原因进行分析排查,最终解决死机问题。
表1 死机信息报告内容
3 死机代码分析
3.1 Exception 2
例如Exception number 2,Bus error-FFFF4818,此类死机原因一般是因为硬件问题引起(典型的是DIO或AIO板故障),但偶尔也会是软件、VME电压和VME接地问题引起。其中FFFF4818是导致死机硬件的内存地址,从表2硬件内存地址表中我们可以查出引起此次死机的是AIO#3电路板,更换AIO #3电路板即可解决此次死机问题。
如果每次出现Exception number 2,Bus error的硬件内存地址都不相同,那么最大的可能就是VME电压被瞬间拉低,此时应该着重检查VME电压。
3.2 Exception 3
Exception 3-Address Error,软件、硬件、接地、电磁干扰均会引起地址错误死机,出现该死机问题时一般先从防电磁干扰方面着手:
(1)检查VME总线架上所有板卡上下螺钉是否拧紧;
(2)空余的插槽是否用铝合金盲板封住;
(3)设备各部件之间EMC接地线(P/N:1390-01554)是否安装;
(4)EMC接地线与设备地线间阻值是否小于2Ω。
如果电磁干扰检查没有问题,那么再从软件方面着手(格式化硬盘、重新安装系统软件等)。
3.3 Exception 4
Exception 4-Illegal Instruction,非法指令引起的死机原因(如系统软件执行了680X0机器代码之外的指令),与Exception 3相似,参照其解决方案。
表2 硬件内存地址表
3.4 Exception 5
Exception 5-Divide by Zero,引起该死机的原因是系统软件BUG,所以,从软件方面着手(如格式化硬盘、重新安装系统软件等)可以解决该死机问题。
3.5 Exception 7
Exception 7-TrapCC,该死机类型具体又分为三小类,分别是Exception 7-TRAPCC(Instruction)、Exception 7-TRAPCC(Failed to Send Software
Heartbeat)和Exception 7-TRAPCC(Other)。
Exception 7-TRAPCC(Instruction),引起该死机的原因是日期或时间冲突,一般指千年虫问题,可通过系统升级的方法来解决该问题。
Exception 7-TRAPCC(Failed to Send Software Heartbeat),引起该死机的原因是某些因素导致SBC板上处理器运行速度变慢。一般有以下几个因素:从硬盘往软盘内拷贝文件、硬盘碎片、过于繁重的SECS通讯任务(设备工艺时上传或下载recipes和sequences)、搜索wafer histories、system constants或event logs,一般重启可解决该问题。
Exception 7-TRAPCC(Other),一般可通过重启解决该问题。
3.6 Exception 24
Exception 24-Spurious Interrupt,引起该死机的原因是VME系统总线IACK信号跳线设置错误,检查每个VME系统总线插槽,如果有板卡那么插上的IACK信号跳线应该为断开,如果没有板卡那么插上的IACK信号跳线应该为短路。
3.7 Exception 31
该死机类型具体又分为三小类,分别是Exception 31-Sys-Fail、Exception 31-Abort Unknown和Exception 31-Memory Parity Error。 Exception 31-Sys-Fail,引起该死机问题一般比较典型的是VME系统总线电源系统和接地问题,可以从以上两方面去解决问题。
Exception 31-Abort Unknown,引起该死机问题一般比较典型的是VME系统总线接地问题或不小心碰了SBC主板上的“abort”按钮,对于后者,只需重新启动系统就行了。
Exception 31-Memory Parity Error,引起该死机问题一般是由于V440型号的SBC主板运算时奇偶校验错误,对于此问题,必须将SBC主板升级至MA3版本。
3.8 Exception 39
该死机类型具体又分为三小类,分别是Exception 39-Failed to Send Software
Heartbeat、Exception 39-Message Pool Full和Exception 39-Memory Pool
Full。
Exception 39-Failed to Send Software Heartbeat,引起该死机问题的类似于Exception 7-TRAPCC(Failed to Send Software Heartbeat),可参照其解决方案。
Exception 39-Message Pool Full,引起该死机问题的原因是系统执行两个任务的时候信息量过载,当信息量大于255条时会导致死机,重新启动系统可解决该问题。
Exception 39-Memory Pool Full,一般系统软件会自动填充和清空内存地址,当系统只填充不清空内存地址时就会导致该内存池出错死机,一般重启可解决。3.9 Exception 46
Exception 46-Array Range Error,一般是因为软件问题引起的死机,可参照Exception 5-Divide by Zero解决该问题。
4 小结
除上述死机代码之外,有些机台可能还会出现一些其他类型的死机代码,也需要用相应的方法来解决,在一时查不出问题的时候可以尝试着从接地、电源、硬盘、软件等方面入手,往往可以取得意想不到的效果。


发布评论