在嵌入式系統(tǒng)開發(fā)中,看門狗是一種重要的機制,用于在程序異常時自動重啟系統(tǒng),保障其穩(wěn)定性。本文將深入探討看門狗及其在程序穩(wěn)定性中的作用,幫助您更好地理解和應(yīng)用看門狗技術(shù)。
? 看門狗
首先需要明確一點:看門狗并不能直接提升程序本身的穩(wěn)定性和可靠性。它僅能在程序運行出現(xiàn)異常時,通過重啟應(yīng)用或系統(tǒng)來恢復功能。程序的穩(wěn)定性和可靠性,從根本上來說,取決于編程過程中的規(guī)范性和嚴謹程度。
看門狗主要分為硬件看門狗和軟件看門狗,二者在實現(xiàn)方式和使用場景上存在顯著差異。
1.?硬件看門狗
硬件看門狗的核心是一個定時電路,由被監(jiān)控的CPU提供周期性的“清狗”信號,即“喂狗”,以清零定時器。在CPU正常工作時,能夠定時“喂狗”,因此看門狗內(nèi)的定時器不會溢出。一旦CPU出現(xiàn)故障,無法繼續(xù)提供“喂狗”信號,看門狗內(nèi)的定時器就會溢出,觸發(fā)復位信號,導致CPU重啟,俗稱“被狗咬”。硬件看門狗又可分為兩種類型:1.1 外部獨立硬件看門狗這種看門狗獨立于MCU/MPU之外,無需驅(qū)動程序支持,只需在規(guī)定時間內(nèi)為喂狗引腳提供一個電平變化即可,通常通過GPIO實現(xiàn)電平切換。其喂狗時間不可設(shè)置,一旦硬件連接完成,就無法關(guān)閉,除非斷開硬件連接。這種看門狗具有極高的可靠性,適用于對產(chǎn)品可靠性要求極高的場合。不過,由于它是獨立的硬件設(shè)備,因此會增加一定的硬件成本。
外部獨立硬件看門狗,主要用于解決惡劣外部環(huán)境導致系統(tǒng)死機且無法人工干預的問題,也能應(yīng)對硬件故障引發(fā)的系統(tǒng)死機重啟需求。
1.2 內(nèi)置硬件看門狗內(nèi)置硬件看門狗是利用處理器內(nèi)部的定時器實現(xiàn)定時操作。它需要在系統(tǒng)中編寫驅(qū)動程序,初始化定時器并實現(xiàn)喂狗操作,甚至可以調(diào)整定時器的參數(shù)。這種看門狗的喂狗時間可調(diào),還可以通過特殊指令關(guān)閉,成本較低。然而,在處理器死機的情況下,它可能會失效,因此適用于對硬件可靠性要求不是特別嚴格的場合。
內(nèi)置硬件看門狗,系統(tǒng)驅(qū)動+應(yīng)用程序喂狗,主要用于解決應(yīng)用程序問題引起的復位重啟,也能應(yīng)對部分外部環(huán)境導致的復位重啟。
2. 軟件看門狗
軟件看門狗的原理與硬件看門狗類似,只是將硬件電路上的定時器替換為處理器的內(nèi)部定時器。這種方式可以簡化硬件電路設(shè)計,但在可靠性方面不如硬件定時器。例如,如果系統(tǒng)內(nèi)部定時器自身發(fā)生故障,就無法檢測到問題。雖然可以通過雙定時器相互監(jiān)視來提高可靠性,但這不僅會增加系統(tǒng)開銷,也無法解決所有問題,比如中斷系統(tǒng)故障導致定時器中斷失效。
軟件看門狗,系統(tǒng)驅(qū)動+應(yīng)用程序喂狗,主要用于監(jiān)控應(yīng)用程序死機問題。
? 看門狗的正確使用
看門狗本身并不是用來解決系統(tǒng)出現(xiàn)的問題。在調(diào)試過程中發(fā)現(xiàn)的故障,應(yīng)該通過排查設(shè)計本身的錯誤來解決。加入看門狗的目的是應(yīng)對程序潛在錯誤和惡劣環(huán)境干擾等因素導致的系統(tǒng)死機,在無人干預的情況下自動恢復系統(tǒng)正常工作狀態(tài)。然而,看門狗也不能完全避免故障造成的損失。畢竟從發(fā)現(xiàn)故障到系統(tǒng)復位恢復正常這段時間內(nèi),系統(tǒng)會處于停滯狀態(tài)。此外,一些系統(tǒng)還需要在復位前保護現(xiàn)場數(shù)據(jù),并在重啟后恢復現(xiàn)場數(shù)據(jù),這可能需要額外的軟硬件開銷。
? 可靠性排序與喂狗操作
綜合來看,看門狗的可靠性排序為:外部獨立看門狗?>?內(nèi)置硬件看門狗?>?軟件看門狗。
對于喂狗操作,外部獨立看門狗由系統(tǒng)自動完成,應(yīng)用程序無需關(guān)心。而應(yīng)用程序需要喂的狗要么是內(nèi)置硬件看門狗,要么是軟件看門狗,這取決于平臺本身提供的資源。
應(yīng)用程序必須在規(guī)定時間內(nèi)進行喂狗操作,以監(jiān)控程序本身的運行健康狀況。如果程序編寫不當導致異常不喂狗,就會引發(fā)系統(tǒng)復位重啟。這就需要程序開發(fā)人員進行問題定位和排查,解決可能影響系統(tǒng)運行的各種潛在問題。
D9系列Cortex-A55?核心板 | |
四/五核Cortex-A55
UART*16 CAN FD*4 千兆以太網(wǎng)*2 |