【DB笔试面试195】在Oracle中，如果$GRID_HOME或/u01目录下的权限被人为修改过，那么如何来修复该权限问题？

2019 年 10 月 10 日
筆記

♣

题目部分

在Oracle中，如果$GRID_HOME或$GRID_BASE或/u01目录下的所有文件权限被人为误操作修改了，那么如何来修复该权限问题？

♣

答案部分

如果使用chown -R误操作将整个$GRID_HOME或$GRID_BASE或/u01目录下的所有文件权限修改了，或者删除了Oracle 11g rac中$GRID_HOME/log文件夹下的所有内容，那么将导致集群不能正常启动。

误操作的命令如下所示：

chown -R oracle.oinstall /u01  chmod -R 444 /u01

可以通过命令“cluvfy comp software -n all -verbose”来校验集群的权限是否正确。

大致可以通过如下几种方法来修复权限问题：

1、根据MOS文档1931142.1提供的建议，可以通过root用户执行命令$GRID_HOME/crs/install/rootcrs.pl -init（11gR2 PSU>11.2.0.3.6的集群）或roothas.pl -init（11gR2 PSU>11.2.0.3.6的单实例）进行解决。对于Oracle 12c版本，需要将rootcrs.pl或roothas.pl修改为rootcrs.sh和roothas.sh。该方法可以用来解决删除了Oracle 11g rac中$GRID_HOME/log文件夹下的所有内容，导致集群不能启动的情况，但是，对于chown -R误操作将整个$GRID_HOME或$GRID_BASE或/u01目录的权限修改了的情况不一定能恢复。

需要注意的是，rootcrs.pl –init是在PSU>11.2.0.3.6下执行的，如果PSU<11.2.0.3.6，那么可以执行如下两条命令来实现同样的效果。

<GRID_HOME>/crs/install/rootcrs.pl -unlock  <GRID_HOME>/crs/install/rootcrs.pl -patch

2、采用MOS文档1515018.1上提供的脚本permission.pl在权限正常的节点上生成修复脚本，然后将生成的修复脚本在异常节点上执行来修复权限问题。可以用来修复chown -R误操作将整个$GRID_HOME或$GRID_BASE或/u01目录的权限修改了的情况。

permission.pl脚本的内容如下所示：

#!/usr/bin/perl -w  #  # Captures file permissions and the owner of the files  # useage : perm1.pl <path to capture permission>  #  # MODIFIED  #     uaswatha   12th March 2018  address filename with spaces (request from customer)    use strict;  use warnings;  use File::Find;  use POSIX();    my (@dir) = @ARGV;  my $linecount=0 ;    #print @ARGV, $#ARGV;    if ($#ARGV < 0) {     print "nnOpps....Invalid Syntax !!!!n" ;     print "Usage   : ./perm1.pl <path to capture permission>nn" ;     print "Example : ./perm1.pl /home/oralcenn" ;     exit ;  }  my $logdir=$dir[0] ;  #my ($sec, $min, $hr, $day, $mon, $year) = localtime;  ##my ($dow,$mon,$date,$hr,$min,$sec,$year) = POSIX::strftime( '%a %b %d %H %M %S %Y', localtime);  my $date = POSIX::strftime( '%a-%b-%d-%H-%M-%S-%Y', localtime);  my $logfile="permission-".$date;  my $cmdfile="restore-perm-".$date.".cmd" ;    open LOGFILE, "> $logfile" or die $! ;  open CMDFILE, "> $cmdfile" or die $! ;  find(&process_file,@dir);    print "Following log files are generatedn" ;  print "logfile      : ".$logfile. "n" ;  print "Command file : ".$cmdfile. "n" ;  print "Linecount : ".$linecount."n" ;  close (LOGFILE) ;  close (CMDFILE) ;      sub process_file {      my ($dev,$ino,$mode,$nlink,$uid,$gid,$rdev,$size, $atime,$mtime,$ctime,$blksize,$blocks,$username,$user,$pass,$comment,$home,$shell,$group);      my %uiduname = () ;      my %gidgname = () ;      my $filename = $File::Find::name;      #### Building uid, username hash        open (PASSWDFILE, '/etc/passwd') ;        while ( <PASSWDFILE>) {         ($user,$pass,$uid,$gid,$comment,$home,$shell)=split (/:/) ;         $uiduname{$uid}=$user ;      }      close (PASSWDFILE) ;      #### Building gid, groupname hash        open (GRPFILE, '/etc/group') ;        while ( <GRPFILE>) {         ($group,$pass,$gid)=split (/:/) ;         $gidgname{$gid}=$group ;      }      close (GRPFILE) ;        ($dev,$ino,$mode,$nlink,$uid,$gid,$rdev,$size, $atime,$mtime,$ctime,$blksize,$blocks) = stat("$filename");  #    printf  "%o %s %s %sn", $mode & 07777, $uiduname{$uid}, $gidgname{$gid}, $filename ;       printf LOGFILE "%o %s %s %sn", $mode & 07777, $uiduname{$uid}, $gidgname{$gid}, ""$filename"" ;       printf CMDFILE "%s %s%s%s %sn", "chown ",$uiduname{$uid}, ":", $gidgname{$gid}, ""$filename"" ;       printf CMDFILE "%s %o %sn", "chmod ",$mode & 07777, ""$filename"" ;      #    printf  "%o %s %s %sn", $mode & 07777, $uiduname{$uid}, $gidgname{$gid}, ",$filename," ;      $linecount++ ;  }

需要注意的是，该脚本会产生2个文件：

a. permission-<time stamp> - This contains file permission in octal value, owner and group information of the files captured  b. restore-perm-<time stamp>.cmd - This contains command to change the permission, owner, and group of the captured files

修复时只需要执行restore-perm-<time stamp>.cmd文件即可。在执行脚本之前，需要将脚本中的节点名称替换成异常节点名。在vi下的替换命令可以为：

:%s/raclhr-11gr2-n2/raclhr-11gr2-n1/g    # 替换每一行中所有 raclhr-11gr2-n2 为 raclhr-11gr2-n1

修复目录/u01/app的过程如下所示：

--备份  ./permission.pl /u01/app  --恢复  chmod -R 775 /u01  #取决于误操作是否有chmod操作  ./restore-perm-<time stamp>.cmd

该方法也是作者推荐的一种方法。

3、Linux环境中还可以通过getfacl和setfacl来恢复。getfacl在权限正常的节点上获取权限，然后修改脚本中的主机名，最后使用setfacl恢复权限，如下所示：

--备份  getfacl -pR /u01/app  > /tmp/bk_lhr_perm_u01_rac1.txt  --恢复  chmod -R 775 /u01  #取决于误操作是否有chmod操作  setfacl --restore=/tmp/bk_lhr_perm_u01_rac1.txt    ---替换脚本中的主机名，注意大小写  :%s/raclhr-11gr2-n1/raclhr-11gr2-n2/g  :%s/raclhr-11gR2-N1/raclhr-11gR2-N2/g

该方法也是作者推荐的一种方法。

4、直接恢复重要文件夹的权限，执行如下命令可以让集群先启动起来，但是，可能会隐藏一些未知的权限问题。如下所示：

chown -R grid:oinstall /u01  chown -R oracle:oinstall /u01/app/oracle  chmod -R 775 /u01/  chown -R grid:oinstall /u01/app/oraInventory  chmod -R 775 /u01/app/oraInventory  chmod 6751 /u01/app/11.2.0/grid/bin/oracle  chmod 6751 /u01/app/oracle/product/11.2.0/dbhome_1/bin/oracle  $ORACLE_HOME/crs/install/rootcrs.pl -init  #$ORACLE_HOME/crs/install/rootcrs.pl -unlock  #$ORACLE_HOME/crs/install/rootcrs.pl -patch

需要注意的是，多数以pl结尾的脚本从12.1.0.2开始都变为了sh脚本，例如：rootcrs.pl需要修改为rootcrs.sh。

5、通过delete node，然后add node来恢复，但是这个过程相对过于复杂，但是或许是最保险的一种方式，Oracle也推荐这样。

6、根据MOS文档：Tips for checking file permissions on GRID environment(ID 1931142.1)来修复该问题。在该文档中描述到，在$GRID_HOME/crs/utl（Oracle 11.2及12.1.0.1）或<GRID_HOME>/crs/utl/<hostname>（Oracle 12.1.0.2）下面的crsconfig_dirs和crsconfig_fileperms文件中记录了整个$GRID_HOME下面的文件和目录的相关权限。文件crsconfig_dirs记录了目录的权限，而文件crsconfig_fileperms记录了相关文件的权限。所以，可以使用crsconfig_fileperms和crsconfig_dirs文件中的信息手动更改权限。

7、可以删除CRS的配置，然后重新运行root.sh即可。如果OCR和数据库不再同一个磁盘组里，那么重新运行root.sh脚本并不影响数据库，所以无需担心。可以用来修复OCR、OLR或表决磁盘损坏的情况，或ASM节点号和主机节点号不一致的情况。在deconfig之前，可以先将OCR的内容导出备份，然后等到root.sh执行成功后再将OCR的内容导入即可。常用命令如下所示：

===================================rac中重新运行root.sh脚本===================================================  需要注意的是，多数以pl结尾的脚本从12.1.0.2开始都变为了sh脚本，例如：rootcrs.pl需要修改为rootcrs.sh  In 12.1.0.2, rootcrs.sh/roothas.sh should be used instead of rootcrs.pl/roothas.pl    # OCR备份，物理和逻辑都进行备份  ocrconfig -export /tmp/export_asm_lhr_logical.bak  ocrconfig -manualbackup  ocrconfig -showbackup  ocrconfig -copy +MGMT:/raclhr-cluster/OCRBACKUP/backup_20190822_085506.ocr.285.1016960109 /tmp/export_asm_lhr_physical.bak #从12.2开始的OCR物理备份默认放在MGMT磁盘组，建议单独cp到FS中  cp /u01/app/11.2.0/grid/cdata/raclhr-cluster/backup_20190822_111554.ocr /tmp/export_asm_lhr_physical.bak  #手动对集群相关资源进行备份，包括新增的db、监听、service等        ----------------- 日志地址  ---11g、12.1.0.2、  日志地址：$ORACLE_HOME/cfgtoollogs/crsconfig/  重置的日志文件：hadelete.log  root.sh脚本日志：rootcrs_rac2.log    ---18c  18c的日志地址：$ORACLE_HOME/install/  18c的详细日志地址：/u01/app/grid/crsdata/raclhr-18c-n1/crsconfig/  重置的日志文件：crsdeconfig_raclhr-18c-n1_2019-08-21_11-21-45AM.log  root.sh脚本日志：rootcrs_raclhr-18c-n1_2019-08-21_11-15-48AM.log      export GRID_HOME=$ORACLE_HOME  # 查询ASM磁盘  $GRID_HOME/bin/kfod disks=asm  st=true ds=true cluster=true  # /grid/stage/ext/bin/kfod disks=asm  st=true ds=true cluster=true      #root用户重新执行root.sh，配置文件：$ORACLE_HOME/crs/install/crsconfig_params  crsctl stop crs -f  #kill -9 `ps -ef|grep d.bin| grep -v grep | awk '{print $2}'`  export GRID_HOME=$ORACLE_HOME  $GRID_HOME/crs/install/rootcrs.pl -deconfig -force -verbose  $GRID_HOME/crs/install/rootcrs.pl -deconfig -force -verbose -lastnode -keepdg  dd if=/dev/zero of=/dev/rhdiskN bs=1024k count=100  --清理磁盘头  find $ORACLE_HOME/gpnp/* -type f -exec rm -rf {} ;  dd if=/dev/zero of=/dev/rhdiskN bs=1024k count=100  --清理磁盘头  #查看磁盘是否有内容  #AIX用：lquerypv -h  /dev/rhdisk5  #linux用：hexdump /dev/sdb ，例如：hexdump -n 1024 -C /dev/sdb1    #保证集群完全关闭，最好重启OS，检查网络情况，是否有cvuqdisk  #find /u01 -name cvuqdisk*  #rpm -qa cvuqdisk  #rpm -ivh $GRID_HOME/cv/rpm/cvuqdisk-*.rpm  #检查配置文件（$ORACLE_HOME/crs/install/crsconfig_params）是否需要修改，18c可以去掉MGMTDB  $GRID_HOME/root.sh  #若出现错误，则在解决错误后可以重复执行，不需要先deconfig    #也可以图形化界面使用GRID配置  #export DISPLAY=192.168.59.1:0.0  #$ORACLE_HOME/crs/config/config.sh      -----------------------------------------------------  --- 对于18c，需要注意：  #若MGMTDB不需要重复创建，则可以修改配置文件  #配置文件（$ORACLE_HOME/crs/install/crsconfig_params）修改以下内容的值为空：    MGMT_DB=  GIMR_CONFIG=    CDATA_BACKUP_DISK_GROUP=  CDATA_BACKUP_FAILURE_GROUPS=  CDATA_BACKUP_QUORUM_GROUPS=  CDATA_BACKUP_DISKS=  CDATA_BACKUP_REDUNDANCY=  CDATA_BACKUP_AUSIZE=  CDATA_BACKUP_SITES=  CDATA_BACKUP_SIZE=  -----------------------------------------------------    # OCR恢复  crsctl stop crs  crsctl start crs -excl -nocrs  #crsctl stop resource ora.crsd -init  ocrconfig -import /tmp/export_asm_lhr_logical.bak  #逻辑备份恢复  #ocrconfig -restore /tmp/export_asm_lhr_physical.bak  #物理备份恢复  crsctl stop crs  crsctl start crs  ===============================================================================================================

在root.sh脚本执行完毕后，如无OCR备份，则可以将数据库、监听和SERVICE等其它资源添加进集群中，例如：

srvctl add db -d lhrrac1 -r PRIMARY -o $ORACLE_HOME  srvctl add instance -d lhrrac1 -i lhrrac11 -n raclhr-11gR2-N1  srvctl add instance -d lhrrac1 -i lhrrac12 -n raclhr-11gR2-N2  srvctl add listener -l LISTENER -o $ORACLE_HOME

8、如果集群所有节点都遭到了破坏，那么也可以删除集群软件，通过重新安装集群软件的办法来解决，这也是最彻底修复问题的办法。当然，如果OCR和MGMT在单独的磁盘组中，那么重新安装软件并不会导致DATA和FRA磁盘组的数据丢失。在重新安装完集群软件后，只需要MOUNT磁盘组DATA和FRA即可。常用命令如下所示：

①　rm -rf /etc/ora*  ②　rm -rf /var/tmp/.oracle  ③　修改/etc/inittab文件，若是Oracle 10g则删除以下3行：  h1:2:respawn:/etc/init.evmd run >/dev/null 2>&1 </dev/null  h2:2:respawn:/etc/init.cssd fatal >/dev/null 2>&1 </dev/null  h3:2:respawn:/etc/init.crsd run >/dev/null 2>&1 </dev/null  若是Oracle 11g则删除以下1行：  h1:35:respawn:/etc/init.d/init.ohasd run >/dev/null 2>&1 </dev/null  ④　rm -rf /tmp/*  ⑤　rm -rf /u01/app/grid/*    --删除GRID目录  ⑥　rm -rf /u01/app/oracle/*  --删除Oracle目录  ⑦　rm -rf /u01/app/oraInventory/*  ⑧　清除OCR、Voting使用过的磁盘  dd if=/dev/zero of=/dev/raw/raw1 bs=104857600 count=1  dd if=/dev/zero of=/dev/raw/raw2 bs=104857600 count=1

在安装有GI的环境下，权限、属主是严格被设定的，任何对于它们的错误修改容易引发一系列的问题，而且这些问题往往都很诡异很难按照常规的思路去诊断。一旦出现权限的问题，个人建议第1、2、3、4种方式来修改。

& 说明：

有关修复权限的更多内容可以参考我的BLOG：http://blog.itpub.net/26736162/viewspace-2157665/、http://blog.itpub.net/26736162/viewspace-2121470/

如果oracle用户下的$ORACLE_HOME/bin/oracle文件的属主或权限出了问题，那么该如何修复呢？

答案：如果可执行文件$ORACLE_HOME/bin/oracle的属主或权限设定出了问题，那么可能会造成很多问题。例如：无法登陆到数据库、ora-600错误、“TNS-12518: TNS:listener could not hand off client connection”、“Linux Error: 32: Broken pipe”、“ORA-12537: TNS:connection closed”、访问ASM磁盘出错等。解决办法很简单，可以在grid用户下运行setasmgidwrap命令重新配置$ORACLE_HOME/bin/oracle可执行文件的权限和属主或者直接将oracle文件的权限修改为6751。$ORACLE_HOME/bin/oracle可执行文件正确属主应该是oracle:asmadmin，并且权限必须有s共享才可以，如下所示：

[root@orclalhr ~]$ which setasmgidwrap  /u01/app/11.2.0/grid/bin/setasmgidwrap  [root@orclalhr ~]$ setasmgidwrap -o /u01/app/oracle/product/11.2.0/dbhome_1/bin/oracle  [root@orclalhr ~]$ ll /u01/app/oracle/product/11.2.0/dbhome_1/bin/oracle  -rwsr-s--x 1 oracle asmadmin 232399083 Apr 21  2015 /u01/app/oracle/product/11.2.0/dbhome_1/bin/oracle  [root@orclalhr ~]# ll /u01/app/11.2.0/grid/bin/oracle  -rwsr-s--x. 1 grid oinstall 203972117 Jan  5  2015 /u01/app/11.2.0/grid/bin/oracle  [root@orclalhr ~]# chmod 6751 /u01/app/oracle/product/11.2.0/dbhome_1/bin/oracle  [root@orclalhr ~]# ll /u01/app/oracle/product/11.2.0/dbhome_1/bin/oracle  -rwsr-s--x 1 oracle asmadmin 232399083 Apr 21  2015 /u01/app/oracle/product/11.2.0/dbhome_1/bin/oracle  [root@orclalhr bin]# cd /u01/app/oracle/product/11.2.0/dbhome_1/bin/  [root@orclalhr bin]# which stat  /usr/bin/stat  [root@orclalhr bin]# stat oracle    File: `oracle'    Size: 210823844       Blocks: 411776     IO Block: 4096   regular file  Device: 802h/2050d      Inode: 1717737     Links: 1  Access: (6751/-rwsr-s--x)  Uid: (  501/  oracle)   Gid: (  504/asmadmin)  Access: 2017-03-16 12:33:44.809363974 +0800  Modify: 2014-05-18 17:09:50.508549983 +0800  Change: 2017-03-16 11:05:15.733816820 +0800

全文请参考：http://blog.itpub.net/26736162/viewspace-2157665/

& 说明：

有关修复权限的更多内容可以参考我的BLOG：http://blog.itpub.net/26736162/viewspace-2157665/、http://blog.itpub.net/26736162/viewspace-2121470/

注意：本文所有方法均已在11.2.0.3、12.1.0.2和18.3.0版本上经过测试成功。

本文选自《Oracle程序员面试笔试宝典》，作者：小麦苗

【DB笔试面试195】在Oracle中，如果$GRID_HOME或/u01目录下的权限被人为修改过，那么如何来修复该权限问题？

VirMach 便宜 VPS

QNews

【DB笔试面试195】在Oracle中，如果$GRID_HOME或/u01目录下的权限被人为修改过，那么如何来修复该权限问题？

分享此文：

Related Posts

Python进阶函数

[MongoDB]MongoDB(projection字段筛选)

oracle–物化视图

【DB笔试面试352】什么是不可用索引（Unusable Indexes），哪些操作会导致索引变为不可用即失效状态？

VirMach 便宜 VPS

QNews

熱門搜尋