NASA在航天任务中推进应用COTS元器件的最新政策(完整演讲稿)
️NASA在航天任务中推进应用COTS元器件的最新政策(完整演讲稿)
编译 | 中国科学院空间应用工程与技术中心 张泽明
️COTS元器件
️在航天项目上的需求和遇到的问题
大家早上好。感谢大家邀请我来发言。我叫苏珊娜·道格拉斯,是 NASA 戈达德太空飞行中心的电子元器件经理,我同时还是 NASA 电子元器件与封装项目(简称 NEPP)的副项目经理,协助该项目经理皮特·马维克开展工作。今天,我很高兴向大家介绍 NEPP 项目在过去一到两年中,在推动 NASA 任务中采用商业COTS EEEE 元器件方面所做的一些主要工作。
EEEE 是“电气、电子、机电、光电元器件”(Electrical, Electronic, Electromechanical, and Electro-optical)的缩写,我们也将光电元器件纳入其中。为什么我们要使用商规COTS元器件?NASA 在过去五年中经历了许多项目延期,甚至有些被取消。而当前影响任务成功的最大障碍之一就是能否按时交付。自从新冠疫情后,我们的供应链受到了严重影响,使我们难以及时获取传统的宇航级或军规级元器件。这极大地影响了项目进度,难以如期交付硬件。
我们最近与戈达德太空飞行中心和喷气推进实验室的工程师们进行了一项商业案例分析,研究这些延误到底给 NASA 带来了多大的成本。分析发现,NASA 因为项目延误而增加的成本高达数亿美元。
COTS 元器件供应更充足及时,但是当前在使用这些元器件时需要投入大量资源来进行筛选和辐射验证,增加了项目风险。一旦测试失败,不仅影响进度,还可能导致整个设计被迫推翻重来。结果是,大多数项目宁愿继续使用传统的、已有飞行经验的器件,而不是尝试新技术。即便某些新技术在小型、快速实施的 Class D 类任务中取得了成功,但由于缺乏简单的技术路径,仍无法应用于更高等级或载人任务。
一个影响我们所有项目的典型例子:每个组件都需要用到片式电容器,而我们通常使用的是军规级或戈达德自定义合格的器件。这类电容的平均交货周期高达 40 周,并没有太多改善。相比之下,一款汽车级的同类电容却可以轻松获得,库存充足,而且价格只是传统空间器件的百分之一甚至更低。
️COTS元器件推进目标
所以 NASA 正在采取行动,以实现更高效地使用商业COTS EEEE 元器件的目标:
️0️1
更新标准。我们即将发布一些新标准,提供替代方法,支持这些 COTS 元器件在太空任务中的使用。我们特别在汽车级器件方面做了大量工作,稍后我会介绍。
️0️2
建立一个合理的辐射加固保障(RHA)方案,依据不同任务的风险等级与所处环境设定。
️0️3
必须在 NASA 内部发展能力,最大程度使用高可靠商规元器件。我们提出的解决方案就是“元器件评估与测试实验室”(PEAL),未来将成为这方面的核心支撑能力。我稍后也会进一步介绍 PEAL 的具体作用。
️COTS元器件最新标准成果
现在我们聚焦一下 NASA 在元器件标准方面的最新工作。
NASA 工程与安全中心(NESC)花了三年时间,制定了一套关于在 NASA 任务中使用商规COTS EEE 元器件的建议。这项研究得到了 NASA 各中心 EEE 元器件工程师的广泛参与。研究的核心结论是:
当 NASA 任务需要使用商规COTS EEE 元器件时,最优路径是采用“成熟的 COTS 元器件”(Established COTS Part)。这是 NESC 报告中提出的一个新术语,指的是由“业界领先制造商”(ILPM,Industry Leading Parts Manufacturer)生产的器件。
ILPM也是报告中新定义的术语,指的是那些采用统计过程控制、具备零缺陷框架、并持续进行可靠性监控的高产量制造商。这些措施能够全面验证器件的可靠性。
当使用 ILPM 生产的“成熟的 COTS 器件”时,只要它满足你的任务应用需求,就几乎不需要额外测试。
NEPP 的 ILPM Pathfinder 项目在过去两年中对此做了大量工作。我们已经完成了一家制造商的评估,并即将完成对 ADI(Analog Devices)的评估。
不过需要指出的是:NESC 的研究并未涵盖辐射问题。因此我们还需要一套专门的 RHA(辐射加固保障)标准,来构建一个完整的 COTS 使用保障体系。
最后,通过建设PEAL(Parts Evaluation and Assessment Laboratory)来推动 NASA 大规模实施 ILPM 认证并处理辐射问题的关键。
NEPP 官网上面新增了一个 ILPM 专区,提供了NASA 工程与安全中心NESC报告的链接,对“成熟的 COTS 器件”和 ILPM 的定义进行了说明。这里可以找到“成熟的 COTS 器件清单”的链接。
目前,这个清单上只有一个器件,但我们正与多家制造商合作,评估其产品是否符合该标准,并计划陆续添加到列表中。
目前我们已经完成了 Susumu公司的评估。他们是我们认证的首家 ILPM,我们合作评估了其 RG 系列薄膜片式电阻器,并将其列入我们的“成熟COTS 器件”清单。
️COTS评价方法框架
这页 PPT 上展示了“成熟COTS 评价矩阵”(Criteria Matrix)。
矩阵列出了什么是 ILPM、什么是“成熟COTS 器件”,以及制造商是如何满足这些标准的。虽然我们无法公开制造商提供给 NASA 的专有文件,但我们至少可以展示他们提交了哪些文档,并说明他们达成了哪些具体的评价标准。
我们也在与其他制造商合作,推动他们的产品进入“成熟COTS 器件”清单。比如我们与 ADI(Analog Devices Inc.)的合作已有实质进展,我们去到了位于马萨诸塞州威明顿的总部进行现场评估。
目前,我们正在就所有 ILPM 数据要求与 ADI 进行最后的沟通。他们已提供了大量关于其供应链和质量流程的文档。我们主要聚焦于他们的汽车级产品(AEC-Q 系列),因为从首次会议上我们了解到,他们对这一系列产品的质量管理措施更加完善。
我们对其中三个具体产品进行了深入数据分析,包括其失效模式与影响分析(FMEA)和过程控制计划(PCP)。他们还提供了这些产品的基于客户反馈的DPPM数据。
我们也发现了一些实际问题,比如在产品寿命测试条件方面还存在空白,尤其是对于部分任务生命周期较长的项目。这些差距未来需要通过独立测试来补足。
因此,我们正在制定一套流程,帮助我们以更高效率将更多 AEC-Q 产品纳入“成熟COTS”列表中。我们目前还在与另外三家供应商合作,欢迎更多厂商加入。
️NASA COTS应用政策标准
我们正在将从 ILPM Pathfinder 项目和 NESC COTS 评估中获得的经验教训,纳入 NASA 的元器件保障标准中。
我们即将启动对 ️NASA 标准 8739.10《EEE 元器件保障标准》的更新工作。但与此同时,我们很快就会发布两项新标准:
️NASA 标准 8739.11《EEEE 元器件测试与降额标准》:目前已完成最新草案的修改,纳入了从 ILPM 项目中学到的经验,预计约一个月内发布;
️NASA 标准 8739.23《辐射加固保障流程标准(RHA)》:也将在大约一个月内发布。
8739.11 标准做了一个关键性的调整:
过去,不论是汽车级(AEC-Q)还是普通商规器件(commercial COTS),我们都将它们视为同类元件,都要求一定的筛选、批次验收测试(LAT)或破坏性物理分析(DPA),根据任务的元器件保障等级(L1 为最高级)来决定测试要求。
但通过 ILPM Pathfinder,我们了解到:制造商在生产 AEC-Q 产品时,投入了更多的质量控制和可靠性保障措施。因此,我们现在采取“Use as it”的方式,让这类产品可以不经额外测试就可用于任务,但前提是必须满足你的任务环境(M)、应用场景(I)和使用寿命(L)。
️汽车级元器件
️在不同风险等级任务中的应用要求
我们制定了一个基本的标准框架,说明如何在不同保障等级的任务中,使用这些 COTS 元器件而不需要附加测试:
️1. Level 3
️(最低等级,适用于 Class C 任务)
使用“ILPM 认证的成熟COTS 器件”,或
项目团队可参照 NASA 的 ILPM 要求,自行向制造商索取以下信息:
◆DPPM(每百万件缺陷数)
◆FIT(失效率)
◆IATF 16949 认证(AEC-Q 产品所需质量认证)
◆Level 3 的 PPAP(产品性能批准流程)文档或等效材料
◆零缺陷框架的证据(如 AECQ-004)
◆持续可靠性监控数据
产品还需是批量供货(high volume)的,因为可靠性是建立在大批量+统计过程控制之上的。
️2. Level 2
️(中等级,适用于 Class B 任务)
同样可使用 ILPM COTS 器件,或自行索取上述文档;
但还需提供制造过程的️Cpk 值趋势(过程能力指数)或 ️良品率趋势,以展示其工艺稳定性。
️3. Level 1
️(最高等级,,适用于 Class A 任务)
推荐团队亲访制造商,确保获取所有必要文件;
并验证这些资料与当前正在采购的具体产品相符,且是最新版本。
️辐射加固保障计划
如果要在 NASA 任务中使用商规 EEEE 元器件,这些器件必须能够在其所处的辐射环境中正常工作。对于许多器件而言,这正是它们无法应用的“卡脖子”问题。
许多项目会选择不用新器件,就是因为一旦使用,就必须进行辐射测试——而测试不仅昂贵,还不确定是否能通过。一旦测试失败,对项目影响极大。
而️元器件级别的辐射测试(Part-Level Radiation Testing)确实花费高昂,尤其对预算紧张的小型任务而言是一种负担。
为了解决这个问题,我们制定了一份新的 ️辐射加固流程标准。这项标准由 NASA 各中心的辐射专家共同参与编写,内容包括:
创建一个任务辐射保障“分类体系”(taxonomy);
该体系允许各个任务根据自身的风险等级(mission risk classification)来选择适当的 RHA 策略;
同时,流程中还引入了️风险管理机制,即当某个器件不完全符合选定的 RHA 分类标准时,项目可以通过系统级别的风险跟踪手段,仍然可以有办法去使用该器件,而不是一刀切地排除。
这个机制为项目提供了“弹性”和“可操作性”,不会因为一个器件没做足测试而全盘否定。
️单粒子效应风险分类管理
针对不同 RHA 分类(Taxonomies)在单粒子效应(Single Event Effects, SEE)方面的要求如下:
用 S1 到 S5 表示从最严格到最宽松的五个级别:
️S1 分类:要求最严格,必须进行器件级辐射测试;
️S2 分类:允许使用元器件级测试或️电路级 / 板级测试来验证器件辐射性能;
️S3–S5 分类:测试要求逐步放宽。
例如,一个项目若采用️S2 分类,那么就不一定需要为每个器件单独做 SEE 测试,而可以通过功能板级测试来满足要求。
这个系统使得不同类型任务(如 CubeSat 和载人任务)可以根据自身风险接受程度与资源限制,灵活配置辐射测试策略。
下面是所有 RHA 分类标准的一个总结矩阵。
几个要点:
每个任务根据其️风险等级会被分配一个推荐的 RHA 分类(S1–S5);
如果项目决定使用比推荐分类更宽松的等级(比如建议用 S2,结果选了 S3),那么就会触发一个项目风险项(Programmatic Risk);
此类风险会被上升到系统层面进行跟踪与管控,确保采取了足够的补偿措施;
对于载人任务(Human-rated Missions),我们是强制要求使用 S1 或 S2 分类的;因为这类任务一旦失败,后果可能是人员伤亡,因此不能接受辐射性能上的不确定性。
总的来说,这一标准的目标是在️保障任务安全与降低成本之间寻找平衡。
️元器件评估与测试实验室
️(PEAL)介绍
PEAL实验室(或称能力中心,Parts Evaluation and Assessment Laboratory)将是 NASA 内部推动商规高可靠器件广泛应用的关键。
️它的目标是
️最大化使用高可靠商规器件(COTS);
同时️最小化任务风险;
建立一支具备器件技术和评估能力的专家队伍。
PEAL 并不仅仅是一个测试场所,而是一种 NASA 内部跨部门、跨专业的联合能力。
推动 PEAL 建设的最直接动力,来自于我们在 ILPM Pathfinder 项目中的一系列经验教训。
在实施 NESC 对 COTS 元器件使用建议的过程中,我们发现:
️1
️成功实施 ILPM 过程需要大量的专业知识;
比如对器件结构、制造工艺、失效模式的深刻理解;
要能在与制造商交流时,问出️对的问题;
️2
️我们不能再用“像对待军品器件那样测试商规器件”的老方法;
我们现在知道,有些商规器件️本身就具备高可靠性;
项目可以️在无需额外测试的前提下直接使用,前提是制造商提供了充分的质量和可靠性文件;
️3
️然而,即使器件被列入“成熟COTS 清单”,项目仍需要判断其是否完全满足自身环境和寿命要求。
问题是,当前参与 ILPM 的专家往往是“兼职”,还承担着其他主责工作。这严重限制了推广进度。
因此,我们需要建立一个️NASA 级别的专职团队,来系统性地开展 ILPM 与商规器件应用的推广和指导工作。
PEAL实验室(Parts Evaluation and Assessment Laboratory)的核心是一个专门的专家团队,这些专家的职责包括:
寻找并评估那些️具备应用潜力的新元器件供应源(特别是用于当前 NASA 任务的关键技术);
与制造商建立并维持关系,️深入了解其产品的质量控制与可靠性措施;
针对商规元器件与任务需求之间的“差距”,制定️有价值的附加测试方案,仅做必要测试,不做冗余验证;
所有测试和分析的结果将被️记录在一个 NASA 级别的数据库中,为任务设计人员提供查阅和参考;
这个数据库将成为️项目在设计新任务时的起点,使其能快速找到经过评估、已知性能的高质量元器件。
这里强调一下,PEAL 不只是一个实验室,更是一个跨专业的专家团队,成员包括:
元器件专家;
辐射专家;
失效分析专家;
测试工程师;
可靠性工程师等。
️他们的工作将包括:
执行元器件测试;
开展新技术评估;
建立并管理制造商关系;
并将这些评估结果纳入数据库,形成️优选器件清单(Preferred Parts List);
这样,NASA 各任务在设计初期就可以从中选用已知可靠、已知测试结果的元器件,而无需从零开始。
这将极大提升任务开发效率,同时减少成本和风险。
️PPT24
需要说明的是,️PEAL 目前还不是一个完全获得资金支持的项目,但我们对其未来的发展充满希望。
目前我们至少已从 NASA 科学任务理事会(Science Mission Directorate)那里获得了一些启动资金,用于今年(2025 财年)开展 PEAL 的初步测试任务。
本财年内,我们已开始对一批元器件进行可靠性与辐射测试。我们计划在今年 8 月的 NASA 电子技术研讨会上公布这些研究的初步结果。
️PPT25
在我结束这次演讲之前,如果不提及我们在 NEPP 项目以及整个 NASA 内部为培养员工所做的大量工作,那将是一大疏忽。为了让 ILPM(基于信息的低测试采购方法)真正成功,我们确实需要教育我们的员工,让他们了解如何使用这一系列新文件,以评估可在几乎无需额外测试的前提下使用的器件的质量与可靠性。
在这一页中,您可以看到我们在过去几年“电子技术研讨会”上提供的所有教程链接,您可以在闲暇时观看这些内容。
我们还为 NASA 零部件工程师开设了一项培训项目,这也是我们非常自豪的成果。这个项目的设计初衷,正是为了在零部件工程领域教育和培训我们自己的工作人员。我们深知,理解半导体制造工艺是应用 ILPM 方法于微电路器件的关键所在,同时也是理解制造商如何建立器件可靠性基础的重要前提。
因此,在我们与三所高校合作开发的培训课程中,课程内容也覆盖了这些关键领域。特别值得一提的是,佛罗里达大学现已提供了一个电子器件工程的结业证书课程。
如果您想了解更多信息,可以访问 NEPP 网站或 JPL(喷气推进实验室)网站,在那里可以获得关于该零部件工程学校的详细介绍。
️总结
总结一下,NASA 已经做了大量工作来推动 NESC(NASA 工程与安全中心)关于 ILPM 概念的实施,并努力建立我之前所展示的 COTS(商业现货器件)成熟器件清单。
我们的建议是,只要某个器件符合任务环境、应用场景和寿命要求,那么这个清单上的器件可以在无需或只需极少额外测试的前提下直接使用。当然,针对功能关键性的不同,还可能需要进行额外的测试,但那将依据具体任务的风险态势,以及由此决定的器件级验证要求来定。
我们已经对相关的零部件保障标准进行了更新,这些标准即将发布,以支持 ILPM 的实施。同时,我们也持续开展员工培训,让他们掌握如何具体执行该流程。
此外,我们很快也会发布新的《辐射与防护保障流程标准》,从而使我们能够采用一种更全面的方式,有效地在未来任务中引入和应用 COTS 器件。
最后,PEAL(Parts Engineering and Analysis Lab)团队将是 NASA 成功实施 ILPM 流程的关键力量。他们将有能力有策略地筛选出满足特定技术需求的器件,并将相关信息提供给各个任务团队,为他们使用新技术器件提供良好的起点。
感谢大家的聆听!