UNIX下幾種常見系統(tǒng)故障和解決辦法
我們作為金融系統(tǒng)的計(jì)算機(jī)系統(tǒng)管理員,從1994年開始就看好了SCO公司的多用戶系列操作系統(tǒng)產(chǎn)品,先后使用了XENIX、SCO UNIX SVR4的普通版和網(wǎng)絡(luò)版、SCO OPENSERVER 5.0.5,原因是這些操作系統(tǒng)產(chǎn)品有多用戶、多任務(wù)的功能,安全保密性比較好,容易掛接圖形、字符終端設(shè)備,網(wǎng)絡(luò)連接簡(jiǎn)單,業(yè)務(wù)使用成本低。但正是由于這些,不可避免地帶來了計(jì)算機(jī)異常關(guān)閉、誤刪系統(tǒng)文件等問題,不象windows系列產(chǎn)品那樣有中文提示、幫助,需要系統(tǒng)維護(hù)人員讀懂系統(tǒng)出現(xiàn)的各種英文提示,手工敲入一條條unix命令來排除各種故障,給系統(tǒng)維護(hù)帶來了困難,也給系統(tǒng)維護(hù)人員提出了比較高的技術(shù)要求。 在實(shí)際工作中,我們發(fā)現(xiàn)造成UNIX系統(tǒng)故障的原因主要有兩個(gè):一是計(jì)算機(jī)異常關(guān)閉,重新啟動(dòng)時(shí)盡管計(jì)算機(jī)會(huì)自動(dòng)檢查文件系統(tǒng),但那些關(guān)于不能自動(dòng)修復(fù)的錯(cuò)誤提示,一線操作人員讀不懂,也不再處理,日積月累造成系統(tǒng)崩潰。二是支行的技術(shù)維護(hù)人員在處理計(jì)算機(jī)故障時(shí)照本宣科,不但原問題沒有解決,又給系統(tǒng)造成了新的傷害。其故障現(xiàn)象集中表現(xiàn)為系統(tǒng)不能引導(dǎo)、不能進(jìn)入多用戶工作方式、login狀態(tài)下所有用戶都不能登錄、系統(tǒng)不能正常關(guān)閉、個(gè)別接終端的串口不能使用等等。解決這些問題所使用的工具主要是安裝好系統(tǒng)時(shí)創(chuàng)建的應(yīng)急系統(tǒng)啟動(dòng)盤,關(guān)于應(yīng)急盤的做法,有很多文章都有介紹,可以參見《中國(guó)金融電腦》2001年第10期《unix系統(tǒng)超級(jí)用戶密碼丟失的處理辦法》中的有關(guān)介紹。下面就幾個(gè)典型常見的故障提示逐一說明解決辦法。
一、計(jì)算機(jī)啟動(dòng)時(shí)提示:
boot not found cannot open; stage 1 boot failure:error loading hd(40) /boot 原因是系統(tǒng)的/boot文件損壞或丟失,造成系統(tǒng)不能啟動(dòng)。修復(fù)辦法: 1、用應(yīng)急盤的boot盤引導(dǎo)系統(tǒng),在Boot:提示下輸入: fd(60) unix.Z root=hd(42) 2、在系統(tǒng)啟動(dòng)時(shí)輸入超級(jí)用戶口令,進(jìn)入單用戶模式,卸載/stand文件系統(tǒng),命令格式: #umount /stand 3、重新加載stand文件系統(tǒng) #mount /stand 執(zhí)行第2、3步的目的是改變/stand的只讀屬性,在缺省情況下,/stand是只讀方式的。 4、架設(shè)引導(dǎo)盤文件系統(tǒng),命令格式: #mount -r /dev/rfd0135ds18 /mnt 5、將引導(dǎo)盤的boot文件拷入硬盤 #cp /mnt/boot /stand 6、卸載軟盤文件系統(tǒng),重新啟動(dòng)計(jì)算機(jī),命令格式: #umount /mnt #reboot
二、計(jì)算機(jī)啟動(dòng)時(shí)提示:
unix not found
然后系統(tǒng)掛起,原因是系統(tǒng)的/unix文件損壞或丟失。解決辦法有兩個(gè):一是使用系統(tǒng)在原來重新連接內(nèi)核時(shí)自動(dòng)備份的舊內(nèi)核啟動(dòng):在Boot:下輸入unix.old啟動(dòng)即可。二是用應(yīng)急啟動(dòng)盤修復(fù),具體操作步驟為:
1、Boot下輸入:fd(60) unix.Z root=hd(42) swap=hd(41) 2、和處理第一種故障類似,系統(tǒng)啟動(dòng)到單用戶方式下,卸載/stand文件系統(tǒng)再加載,將軟盤的unix.Z拷入硬盤。命令格式:
#umount /stand #mount /stand #mount -r /dev/rfd0135ds18 /mnt #cp /mnt/unix.Z /stand #reboot
三、系統(tǒng)啟動(dòng)后不能進(jìn)入多用戶工作方式
造成這種情況的原因一般有兩種可能:
1、/etc/inittab文件丟失或損壞 2、/etc/passwd文件丟失或損壞
如果在系統(tǒng)在引導(dǎo)時(shí)提示: init:cannot open /etc/inittab errno:2
然后按+d進(jìn)入多用戶失敗。則表明是/etc/inittab文件丟失或損壞,而此文件包括init命令,控制計(jì)算機(jī)所進(jìn)入的init級(jí)別,其中init 0就是關(guān)閉計(jì)算機(jī),init 1為進(jìn)入單用戶工作方式,init 2是系統(tǒng)啟動(dòng)時(shí)默認(rèn)的多用戶運(yùn)行級(jí)別。解決辦法是修復(fù)inittab文件,重新建立unix內(nèi)核。解決辦法有兩個(gè):
1、重新建立inittab的文件聯(lián)結(jié),命令格式: #ln -s /var/opt/K/SCO/unix/5.0.5a/etc/inittab /etc.inittab
2、重構(gòu)inittab文件
#touch /etc/.new-unix #cd /etc/conf/bin #./idmkenv 在系統(tǒng)提示下輸入'y',然后輸入: #cat /etc/inittab 完成上述工作后,輸入: #init 2
就可以進(jìn)入多用戶操作系統(tǒng)了。
如果在系統(tǒng)引導(dǎo)時(shí)提示
su:unknown id:root init:single user mode password file missing entering system maintenance mode
然后系統(tǒng)只能進(jìn)入單用戶維護(hù)模式,則表明是/etc/passwd文件丟失或損壞。如果使用l 命令顯示文件的長(zhǎng)列表,系統(tǒng)會(huì)首先顯示:/etc/passwd cannot be opened for reading。解決辦法是將應(yīng)急盤的root盤(第二張應(yīng)急盤)中的passwd文件拷入硬盤,修改passwd文件的屬主和屬組。命令格式為:
#mount -r; /dev/rfd0135ds18 /mnt #cp /mnt/etc/passwd /etc/passwd #chown bin:auth passwd #reboot
四、系統(tǒng)不能正常關(guān)閉
計(jì)算機(jī)運(yùn)行正常,但系統(tǒng)關(guān)閉輸入shutdown -g0 -i0 -y命令后,計(jì)算機(jī)提示/etc/initscript:/etc/uadmin:not found,然后系統(tǒng)掛起。造成每次關(guān)閉計(jì)算機(jī)都是非正常關(guān)機(jī),開機(jī)就需要檢查文件系統(tǒng)。原因是/etc/uadmin文件丟失或損壞。解決辦法是將應(yīng)急啟動(dòng)root盤的uadmin文件拷入硬盤,命令格式為:
系統(tǒng)以單用戶方式啟動(dòng),檢查完文件系統(tǒng)后:
#mount /dev/rfd0135ds18 /mnt #cp /mnt/etc/uadmin /etc/uadmin #chown bin:bin /etc/uadmin #umount /mnt #reboot
五、個(gè)別串口所聯(lián)結(jié)的終端上所有用戶都不能注冊(cè)
其現(xiàn)象為終端、連接線都正常,終端上也顯示login提示符,但是在用戶名后系統(tǒng)提示terminal 串口名(比如tty21a等) is disabled ---see account administrator,然后又退出到login提示符下,普通用戶都不能登錄系統(tǒng)。原因是初裝系統(tǒng)時(shí)系統(tǒng)默認(rèn)用戶最多不成功登錄次數(shù)為99次,如果超過這一次數(shù),系統(tǒng)將自動(dòng)將此串口鎖住。解決辦法是超級(jí)用戶登錄后,使用scoadmin管理工具,操作步驟為:scoadminàsystemàterminal manageràunlock,按功能鍵選出被鎖住的終端口,解鎖。然后退出到terminal manageràoptions,其中的maximum unsuccessful attempts before locking terminal 默認(rèn)選項(xiàng)為99次,改為infinte(不限制),這樣以后用戶再有超過99次的不正確的登錄也不會(huì)鎖死終端串口。
長(zhǎng)期的工作實(shí)踐發(fā)現(xiàn)計(jì)算機(jī)操作系統(tǒng)中,感覺到sco公司的unix操作系統(tǒng)還是很穩(wěn)定可靠的。在實(shí)際應(yīng)用中要象windows平臺(tái)下檢查病毒那樣經(jīng)常使用fsck -y 命令檢查文件系統(tǒng)的一致性并自動(dòng)修復(fù)錯(cuò)誤。一旦計(jì)算機(jī)系統(tǒng)出現(xiàn)故障,無論是一線操作人員還是技術(shù)維護(hù)人員,都要將計(jì)算機(jī)的異常現(xiàn)象、處理措施和步驟記錄在案,為將來進(jìn)一步更高一級(jí)的技術(shù)處理提供了詳細(xì)的資料,同時(shí)也是工作經(jīng)驗(yàn)的文字積累過程,為經(jīng)驗(yàn)的交流提供了良好的基礎(chǔ)。
相關(guān)文章:
