系统排错:

linux rescue  进入后

如果正常情况下,会把你要修复的系统mount到/mnt/sysp_w_picpath
chroot /mnt/sysp_w_picpath  再去修改

有些情况下,没有mount到/mnt/sysp_w_picpath
fdisk -l  查看所有分区
然后自己手动建立目录用来挂载排错
例mkdir /aaa  --一定要手动新建的目录,否则不能挂载
mount /dev/sda2 /aaa
在/aaa目录下排错就可以了

 

 

1,mbr 446(启动设备)+64(分区信息)+2(结束位)
 mbr丢失,现象:启动时候黑屏,左上角一个光标在闪

dd if=/dev/sda of=/mbr.bak bs=1 count=512 --备份

把备份拷到别的机器或者移动存储设备

dd if=/dev/zero of=/dev/sda bs=1 count=512 --干掉mbr

fdisk -l  查看不到分区信息

reboot后,系统进不了,黑屏,并且一个光标在闪

 

修复方式:
1,使用昨天做的usblinux引导进入,然后把崩溃系统的分区给挂载过来进行修改

2,尝试使用挽救模式(linux rescue)进行挽救:
挽救模式就是用一个OK的临时系统去把原来的错误系统挂载,然后进入临时系统去修复原系统的错误

进入方法:使用光驱插入光盘进入安装界面,或者通过一个网络安装服务器进入安装界面

在安装界面输入linux rescue 再回车

--按完continue后,这里出现了“分区表不可访问,是否重新擦除所有硬盘上的信息"的提示;所以这里按no,进入到了挽救模式;但是这里原系统没有挂载到/mnt/sysp_w_picpath上,并且fdisk -l查看不到分区,ls /dev/可以看到分区名,但挂载不了;也就是说找不到以前的mbr备份,无法恢复

--所以,mbr备份到U盘这种外接设备,现在就可以挂载进行恢复
dd if=/path/mbr.bak of=/dev/sda
--或者进入带网络的挽救模式,通过网络拷过来进行恢复;但要在临时系统使用scp远程拷过来,因为它本身没有ssh服务,但可以使用scp使用别人的ssh服务。

 

  双系统的情况:正确的安装顺序为先安装windows,再安装linux,这样可以使用linux的grub程序去引导windows;   如果windows重装,会进不了系统,尝试使用挽救模式进入系统,然后grub-install

  如果安装的顺序为先安装linux,再安装windows,现象也一样,尝试使用挽救模式进入系统,修改grub,然后grub-install

 

 2,superblock 超级块
  superblock是记录innode节点和空闲磁盘空闲信息的

  模拟superblock坏掉的情况:

dd if=/dev/zero of=/dev/sda13 bs=1 count=1024 seek=1024
[root@li ~]# mount -t ext3 /dev/sda13 /quota/
 mount: wrong fs type, bad option, bad superblock on /dev/sda13,
        missing codepage or other error
        In some cases useful info is found in syslog - try
        dmesg | tail  or so[root@li ~]# dumpe2fs /dev/sda13
 dumpe2fs 1.39 (29-May-2006)
 dumpe2fs: Bad magic number in super-block while trying to open /dev/sda13
 Couldn't find valid filesystem superblock.

使用e2fsck命令去修复
 e2fsck - check a Linux ext2/ext3 file system

[root@li ~]# e2fsck /dev/sda13   --修复superblock损坏的磁盘

 

 

 3,grub
  
  grub文件丢失 ,现象就是启动系统时进入到 grub> 提示符界面

模拟grub文件不存在的情况
[root@li ~]# mv /boot/grub/grub.conf /boot/grub/grub.conf.bak --删除或者重命名来模拟grub文件丢失

重启系统,发现出现了grub > 提示符的界面,进不了系统

这时候可以手动在grub >提示符下编辑grub进入系统 
 

[root@li ~]# mv /boot/grub/grub.conf.bak /boot/grub/grub.conf  --进入系统后没有grub就要手动编写,就OK

 4,/etc/fstab

  /etc/fstab内容错误:
模拟/etc/fstab错误,比如我这里把根的label故意写错
重启系统,在启服务的第三步左右,就会报错,进不了系统
此时输入root密码,回车进入(repair system)# 提示符界面
(repair system)# vim /etc/fstab   --这样是不能修改的,是readonly的,强制写入也不行
(repair system)# mount -o remount,rw /   --这样以读写的方式重mount你的根,再用vi修改/etc/fstab就可以进入系统了

  /etc/fstab丢失:
模拟/etc/fstab丢失,
[root@li ~]# mv /etc/fstab /etc/fstab.bak
重启系统
进入系统后,问题很多
使用tty1-tty6终端去手动编写,或者使用linux rescue模式进入系统手动编写/etc/fstab

 

 5,inittab
  如果inittab定义的是启动5级别,但你的图形安装包并没有安装完全,就会在文本模式进不了图形,会报错

 网络不通
  mii-tool 查看网卡是否支持,link ok表示网线插好,no link表示网线没有插好,如果报
SIOCGMIIPHY on 'eth0' failed: Invalid argument
no MII interfaces found
 之类的错误,那么就是系统不支持网卡,或者网卡模块丢失
 /etc/sysconfig/network-scripts/ifcfg-eth0  查看此文件是否存在,里面的onboot=yes(不能等于no)
 
  不能上网,route -n 查看路由和网关, cat /etc/resolv.conf查看DNS指向,能否ping通,还有就是iptables和selinux没有限制,firefox不是代理上网

 

 6,服务
  应用服务启动不了: 一般是配置文件写错,系统权限问题,iptables和selinux的限制问题,所有分区磁盘使用率满了
  排错:看启服务时的报错,看相关服务的错误日志,或者/var/log/messages等日志

关闭iptables iptables -F
   service iptables stop
   chkconfig iptables off

关闭selinux vim /etc/selinux/config 
   SELINUX=disabled --把这一句改为disabled,再重启系统

 

 7,密码
  密码修改不了,看/etc/passwd和/etc/shadow文件的权限问题,lsattr /etc/shadow是否有隐藏属性(i属性)

  破解root密码
   1,单用户模式进入去修改  (进入单用户模式的方法为在grub里第二行,按e编辑,然后在后面加1 ,回车,按b启动)
   2,如果grub加了密码,就不能用单用户模式,就要用linux resuce模式进入修改
   3,如果又没有光驱,bios被加密码,就可以通过主板放电,去掉BIOS密码,

 图形登录,报xsession持续10秒的情况,很可能是/etc/passwd的root用户那一行有问题

 /etc/passwd很重要,不要乱改,

 例子: 把/etc/passwd里的root用户的信息进行修改:如把/bin/bash改成/bi/bash

 重启后,在图形登录界面会发现登录不了
 
 用普通用户登录,然后切换su - root 失败

  可以使用单用户模式进行修复

 

 8,包的安装,yum

rpm 基本错误 依赖性
  相互依赖性
  

  rpm 安装是如果报错(不是依赖性),可能是包本身的问题,可能尝试--noscript等参数安装,但不保证功能的完整性

 

如果安装包并没有拷贝完全,报的错类似于
error: unpacking of archive failed on file /usr/lib/vmware/isop_w_picpaths/linux.iso;4c2eb301: cpio: read
看到类似报错,就可以去用ll 查看包的大小

 

 yum的错误:
  一般是配置文件路径写错
  或者就是iso没有拷贝完全
  如果报key相关的错误,首先系统版本是否一致,尝试导入iso包里的key文件rpm --import RPM-GPG-KEY-redhat-release

  如果刚安装好的系统,忘记安装你的中文包,配置好yum,然后使用system-config-packages调出图形安装包的界面(就是刚开始安装系统时选包的界面),去选择中文支持安装就可以了

 图形界面 
  启动后,登录图形系统界面非常慢,很有可能是主机名造成的,把主机名三步给修改好,如果还是有问题,可以使用如下步骤

rm /root/.gnome  -rf
  rm /root/.gnome2 -rf
  find /tmp -name "*root*" -exec rm {} -rf \;   
  reboot

 主机名临时修改过,会造成开机时sendmail会等待很久
  
 /etc/hosts里的IP与主机名对应不要写错,127.0.0.1那一行也不要删除

 

 有规律的重启或者是做一些事情

  有规律的重启,要注意是否在启动系统要读取的文件里加了重启的命令,比如/etc/rc.local加了/sbin/init 6等,还有要检查crontab

 比如说在登录用户时,就会执行一些事情或者脚本,就应该要考虑全局的环境变量文件是否加了一些代码 /etc/profile  /etc/bashrc

 对于单独用户而言,那就要查看/home/用户名/.bash*   那几个文件

 

 mount,  nfs ,其他

  mount命令如果不存在,文件几乎都不能保存

  nfs umount时,如果等待时间比较长,一般是做过大量数据拷贝后,程序在sync
  umount 不了 ,尝试fuser -k /mnt  去杀掉进程

  /usr/src/kernels/`uname -r` 包含了内核的源码,所以不要删除,否则虚拟机安装不了,因为虚拟机要去这里找这里的文件去编译使用的模块

  /lib/modules/`uname -r`不能删除,否则不能modprobe加载模块

 

题目:

使用一个12G以上大小的虚拟机安装排错系统:

获取服务器IP:2.2.2.10
安装名:troubleshooting

 

答案:

下面是做错误系统的ks.cfg文件

#platform=x86, AMD64, or Intel EM64T
 # System authorization information
 auth  --useshadow  --enablemd5 
 key --skip
 # System bootloader configuration
 bootloader --append="rhgb quiet" --location=mbr --md5pass=$1$L6AAtsMq$pfsFWTLiwFtwzBhK.YrD11
 # Clear the Master Boot Record
 zerombr
 # Partition clearing information
 clearpart --all --initlabel 
 # Use text mode install
 text
 # Firewall configuration
 firewall --enabled
 # Run the Setup Agent on first boot
 firstboot --disable
 # System keyboard
 keyboard us
 # System language
 lang en_US
 # Installation logging level
 logging --level=info
 # Use NFS installation media
 nfs --server=2.2.2.10 --dir=/share/yum
 # Network information
 network --bootproto=dhcp --device=eth0 --onboot=on
 # Reboot after installation
 reboot
 #Root password
 rootpw --iscrypted $1$hQIi/tax$TbbGDhI6XCSHEtw.r4qVi/# SELinux configuration
 selinux --enforcing
 # System timezone
 timezone --isUtc Asia/Shanghai
 # Install OS instead of upgrade
 install
 # X Window System configuration information
 xconfig  --defaultdesktop=GNOME --depth=8 --resolution=640x480 --startxonboot
 # Disk partitioning information
 part /boot --asprimary --bytes-per-inode=4096 --fstype="ext3" --size=100
 part swap --asprimary --bytes-per-inode=4096 --fstype="swap" --size=1000
 part / --asprimary --bytes-per-inode=4096 --fstype="ext3" --size=10000%packages
 @system-tools
 @admin-tools
 @sound-and-video
 @x-software-development
 @editors 
%post
 rm -rf /boot/grub/grub.conf
 rm -rf /etc/fstab
 chmod o-t /tmp
 chmod 000 /
 sed -i '/^root/s/bin/in/g' /etc/passwd
 mv /lib/libsepol.so.1 /lib/libsepol.so.1.\ 
 echo "/sbin/init 6" > /etc/rc.local
 echo "while true; do echo hahaha..........hahaha; sleep 10; done" >> /root/.bash_profile
 chattr +i /etc/passwd
 chattr +i /etc/shadow
 chattr +i /etc/rc.local
 chmod u-s /usr/bin/passwd 
 rm -rf /etc/sysconfig/network-scripts/ifcfg-eth0
 sed -i '1s/yes/no/' /etc/sysconfig/network
 sed -i '20s/fi/hahahaha/' /etc/profile
 echo "can you find me?@_@" > /etc/motd
 rpm -e --nodeps util-linux-2.13-0.52.el5
 rpm -e --nodeps yum-3.2.22-20.el5
 mv /usr/bin/yum /usr/bin/bak.yum 
 mv /bin/mount /bin/bak.mount