EEJournal

专题文章
现在就订阅

失去哈勃-拯救哈勃

在工作了31年之后,哈勃太空望远镜几近死亡。

我想这将会是很长很长的一段时间
直到着陆让我再次发现
我不是他们在家里想的那个人
哦,不,不,不,我是个火箭人
火箭人,一个人在这里烧断了保险丝
- - - - - -
Elton John和Bernie Taupin,“Rocketman”

哈勃太空望远镜(HST)的有效载荷计算机于2021年6月13日星期日进入安全模式。哈勃的科学仪器一片寂静,美国宇航局试图将有效载荷计算机从安全模式恢复到运行状态,但多次失败。十多年前,美国宇航局退役了唯一能够到达并修复哈勃的航天器——太空运输系统(俗称航天飞机)。

虽然有人说要重新分配现有的航天器,如SpaceX Crew Dragon,以执行HST维修任务,但这种说法是不切实际的。乘员龙缺乏舱外活动(EVA)所需的气闸。只有航天飞机足够大,足够坚固,可以运送一名机组人员,并进行所需的eva,以抓取和固定HST。航天飞机已经执行了五次HST的维修任务,但现在它走了。没有航天飞机,我们可能会永远失去哈勃。

但我们没有。至少这次不是。

6月13日,HST有效载荷计算机停止并进入安全模式后,NASA工程团队开始运行测试并分析测试数据。结果表明,有效负载计算机的内存模块可能是问题的根本原因,因为内存错误(无法从内存中读取已写入的内容)是观察到的故障症状之一。

HST有效载荷计算机是NASA标准航天器计算机-1 (NSSC-1)系统,建于20世纪80年代。这台有效载荷计算机位于哈勃科学仪器指挥和数据处理(SI C&DH)单元内,控制和协调来自HST各种科学仪器的数据流,并监测它们的状态。

哈勃太空望远镜于1990年发射升空,三十多年来,它为人类提供了一个观察宇宙的前排座位。
图片来源:NASA

最初的NSSC-1计算机是由NASA戈达德太空飞行中心和西屋电气公司在20世纪70年代早期开发的,用于多个计划中的任务。这台计算机的最早版本包含了1700个(也就是一千七百个)仙童半导体公司的DTL小型平板封装ic(而不是什么新奇的微处理器芯片)。对于千禧一代的人来说,DTL是20世纪60年代初推出的早期逻辑家族,首先由Signetics推出,然后由Fairchild Semiconductor推出。缩写代表“二极管晶体管逻辑”。

洛克希德航天系统公司在1977年赢得建造HST的合同后,将NSSC-1纳入了HST的设计。HST终于在13年后的1990年发射。早在HST推出之前,NSSC-1处理器被重新设计,以适应哈里斯半导体公司开发的一些非常早期的MSI TTL门阵列,后来被TRW公司功能等效但速度更快的门阵列所取代。每个门阵列集成电路集成了大约130个逻辑门。

(通过一系列收购和合并,哈里斯半导体现在是瑞萨电子的一部分。仙童半导体(Fairchild Semiconductor)被收购,又被剥离出来,然后又被收购。它现在是安森美半导体的一部分,后者是从摩托罗拉半导体剥离出来的。如果你能在没有维基百科的帮助下跟踪这些公司的变化,那么你的记忆力比我好得多。)

NSSC-1计算机的主存储器也使用了18位磁芯或镀线存储器,而不是半导体存储器。这是非常非常老的技术,但是微处理器和半导体存储器在当时还没有为太空任务做好准备。对于NASA的要求来说,它们太新了,也没有经过试验。

HST最初的SI C&DH单元在2008年遭遇了处理器故障,因此NASA将科学任务的控制权转移到备用有效载荷计算机上。这次故障恰好发生在航天飞机STS-125任务的17天前,该任务原定于2008年飞往HST进行第三次在轨服务。NASA将STS-125任务推迟到2009年5月,这使得有足够的时间准备好现有的备用SI C&DH单元和两台新的有效载荷计算机。STS-125更换了替换的SI C&DH单元,并恢复了HST的运营冗余,这将在12年多后的2021年成为最幸运的事情。

以下是首席飞行主管托尼·切卡奇对STS-125修复任务的描述:

“这更像是脑外科手术,而不是建筑。在空间站的太空行走中,你要安装大型设备——桁架、模块等——然后像架设机一样把它们组装在一起。哈勃望远镜不能做到这一点。哈勃太空行走相当于站在手术台上,做非常灵巧的工作。”

STS-125是一项复杂的维修和升级任务,需要5次舱外飞行。每次舱外活动计划持续约6.5小时,但由于工作困难和复杂,大多数STS-125舱外活动需要7到8小时。STS-125是哈勃第五次也是最后一次维修任务。它的目标是将哈勃望远镜的使用寿命延长到2014年甚至更久。NASA在STS-125之后不久就退役了航天飞机,剩下的航天飞机现在都是博物馆的藏品。航天飞机再也不可能执行任务了。现在是2021年,哈勃望远镜仍在继续工作,并提供无价的科学数据。STS-125确实非常成功。

STS-125在替换失效有效载荷计算机时将有效载荷计算机的主存储器从磁芯升级为CMOS RAM。SI C&DH单元中的两个冗余负载计算机都可以访问四个独立的64Kword CMOS内存模块中的任何一个。然而,由于NSSC-1计算机的内存空间被限制为64 Kwords,因此一次只能使用一个CMOS内存模块。其余三个CMOS内存模块作为冗余备份。在使用其他内存模块进行测试时,当内存错误再次出现时,NASA工程师得出的结论是,这可能根本不是内存故障,而是不同类型的硬件故障,因为所有四个内存模块同时故障的可能性很小。

到目前为止,哈勃的科学任务已经沉寂了一个多星期,美国宇航局的工程师仍然没有怀疑根本原因。

NASA工程师在6月23日和24日进行了额外的测试。这些测试是自2009年STS-125修复任务期间备份有效载荷计算机安装在HST以来的第一次。在太空冬眠十多年后,备用有效载荷计算机成功点火。然而,测试结果显示,使用主负载计算机和备份负载计算机的许多硬件组合,在使用四个内存模块中的任何一个时都出现了相同的内存错误。

NASA官方列出的哈勃有效载荷计算机组件包括:

  • 中央处理模块(CPM),它处理协调和控制科学仪器的命令
  • 一个标准接口,用于连接计算机的CPM和其他组件之间的通信
  • 一种通信总线,它包含在硬件之间传递信号和数据的线路
  • 一种主动存储器模块,用于向仪器存储操作命令。还有三个额外的模块作为备份。

作为一名具有丰富故障排除经验的老系统工程师,我立即发现这个列表中缺少电源。一个不正常的电源会导致各种各样的故障,包括读/写内存问题。

系统故障排除的第一条戒律,经常被我的朋友Dave Jones引用EEVblogYouTube视频,是:

“你应该测试电源电压。”

显然,从现有的HST遥测数据来看,这是不可能的。更糟糕的是,Fluke不卖我的20世纪80年代中期的Fluke 77 DMM的测试引线,它将到达HST的340英里轨道。(是的,我查过了。福禄克的所有测试导线似乎都有1.5米长——大约短了340英里。)

科学仪器指挥和数据处理(SI C&DH)单元由两台独立的计算机组成,每台计算机都能够处理科学数据并将其发送到地球,它有四个冗余内存模块和两个电源单元。STS-125在2009年安装了这个替换SI C&DH单元。图片来源:NASA

截至6月30日,美国宇航局哈勃博客报道称,“计算机问题的根源在于科学仪器指挥和数据处理(SI C&DH)单元……SI C&DH上的一些硬件部件可能是罪魁祸首。”该博客继续写道:

该团队目前正在仔细研究命令单元/科学数据格式化器(CU/SDF),它可以发送和格式化命令和数据。他们还在研究电源控制单元中的电源调节器,其设计目的是确保有效载荷计算机硬件的稳定电压供应。”

经过更多的思考和测试,在有效载荷计算机进入安全模式一个月后,NASA博客于7月14日报道:

“一系列多天的测试,包括试图重新启动和重新配置计算机和备份计算机,都没有成功,但从这些活动中收集的信息使哈勃团队确定,问题的可能原因是电源控制单元(PCU)。

PCU也位于SI C&DH单元上。它确保有效载荷计算机硬件的稳定电压供应。PCU包含一个电源调节器,为有效载荷计算机及其存储器提供恒定的5伏电力。二级保护电路检测离开电源调节器的电压水平。如果电压低于或超过允许的水平,这个次级电路告诉有效负载计算机它应该停止操作。该团队的分析表明,要么是稳压器的电压水平超出了可接受的水平(从而跳闸二级保护电路),要么是二级保护电路随着时间的推移而退化,并处于抑制状态。”

当你的系统在340英里外的近地轨道上时,断电是一件可怕的事情。许多维修死机电源的公司在LinkedIn上推销自己,但没有一家可能会到HST进行现场维修。

如果哈勃的有效载荷计算机除了双冗余处理器和四冗余内存之外还包括一个冗余电源就好了。

当然,有效载荷计算机有一个冗余电源,在SI C&DH单元中。

故障发生一个月后,7月14日NASA的博客提到:“因为没有地面命令能够重置PCU,哈勃团队将切换到包含备份PCU的SI C&DH单元的备份端。”

然后:

  • 7月16日,NASA博客报道,工程师们已经成功激活了哈勃SI C&DH单元中的备份PCU和备份命令单元/科学数据格式化器(CU/SDF)。
  • 7月17日,美国宇航局的博客报道说,哈勃现在已经重新上线,准备继续它的科学任务。
  • 7月19日,科学任务恢复。哈勃再次开始为它的图书馆增加超过150万张令人难以置信的图像和观测数据。

经过一个月的测试,美国宇航局的工程师们决定切换到冗余的动力单元,并在五天内使哈勃的科学仪器重新启动。NASA小心翼翼地通过远程控制成功地修复了哈勃望远镜,哈勃望远镜的科学水龙头再次打开。这是NASA唯一的修理方案。多亏了洛克希德公司的工程师在40多年前设计的冗余设计,以及熟练的航天飞机机组人员20年的定期维护和维修,NASA的工程师们拯救了哈勃。

注:

  • 观看一个2小时的关于哈勃太空望远镜发展的精彩视频讨论,由一些在该项目工作多年的洛克希德工程师提供,点击在这里.本次网络研讨会于2021年4月由硅谷技术历史委员会以及IEEE圣克拉拉谷分会的IEEE生命成员亲和小组。
  • 要查看NASA关于哈勃近乎奇迹般地修复工程的完整博客历史,请点击在这里
  • 如果你想了解更多关于NSSC-1计算机的细节,请阅读
  • 你可能还记得哈勃太空望远镜的主要飞行和管理计算机在1999年12月STS-103期间被替换为英特尔80486 DX2微处理器。英特尔最新的首席执行官Pat Gelsinger是80486项目的首席架构师,他也大量参与了时钟加倍的DX2版本。

关于“失去哈勃-拯救哈勃”的8个想法

  1. 做得好,史蒂夫。哈勃望远镜是一项了不起的任务。还有多少科学项目的成果被挂在艺术博物馆里?当它最终消失时,我们将会错过它,但让我们希望詹姆斯·韦伯望远镜能填补它(唉,只是在红外波段)。

    1. 谢谢杰克!很高兴收到你的来信。我同意,哈勃的图像是惊人的,在第一次服务任务后,拿起了一些眼镜来修复镜子的近视。

  2. 精彩的事件描述!感谢所有保持数据从太空流动的人!

    问题:现在这个系统肯定不再是多余的,如果有的话,有什么计划来解决哈勃望远镜上的“SPOF”或单点故障?

    1. beekay,计划中的修复是韦伯望远镜,它是一个替代品,而不是修复。现在美国的航天飞机已经退役了,我们没有实际的办法去修理哈勃。

    1. gene plichota,如果没有5次服务任务和哈勃地面团队的奉献工作,我们永远不可能做这样的科学研究,也不可能得到这样令人惊叹的图像。哈勃发射时主镜有缺陷。最初的图像比预期的要模糊。第一个服务团负责修理近视镜的辅助镜片。

留下回复

有特色的博客
2022年12月22日
当谈到汽车、摩托车和动力设备时,本田是一个家喻户晓的名字,也是世界上最大的汽车制造商之一。在汽车开发周期的一个关键阶段是发动机的功能保证,具体地说,就是保证发动机的头部。
2022年12月20日
作者:James Paris和Armen Asatryan在实现过程中自动进行简短检查,让设计团队快速找到并修复这些错误... ...
2022年12月20日
我们在Synopsys上回顾了2022年,包括基于云的芯片设计工具、机器学习和人工智能驱动的EDA解决方案、多模系统和安全接口IP。回顾一年:回顾2022年的关键技术进步和冒险,这篇文章首次出现在来自硅…
2022年12月15日
看完这个视频后,我非常想创建我自己的电磁/水浴相控阵实现....

有特色的视频

通过端到端解决方案实现内存设计和开发的新范式

Synopsys对此

为了满足高性能计算、人工智能和汽车应用的需求,对高度定制的高性能存储芯片的需求正在推动对新的设计范式的需求,如DTCO、左移设计、数字化和可靠性设计。

了解有关内存解决方案的更多信息

特色粉笔谈话亚博里的电子竞技

使用Cadence Cloud在电子设计中实现数字化转换

Cadence设计系统

随着设计规模的增加、高级节点的复杂性以及更快的上市时间需求,设计团队正在寻找可扩展性、简单性、灵活性和敏捷性。在今天的Chalk T亚博里的电子竞技alk中,Amelia Dalton与Mahesh Turaga讨论了Cadence的端到端云投资组合的细节,如何通过按下Cadence的新混合云和Cadence的云解决方案来扩展您的on-prem环境,您可以帮助您从设计创建到系统设计等等。

点击这里了解更多关于Cadence Cloud Portfolio的信息

Baidu