请教如何查找windows集群发生切换的原因

请教如何查找windows集群发生切换的原因,第1张

1、主节点数据库日志

Tue Sep 17 07:28:50 2013

Shutting down instance: further logons disabled

Shutting down instance (immediate)

License high water mark = 123

Waiting for dispatcher 'D000' to shutdown

All dispatchers and shared servers shutdown

Tue Sep 17 07:28:53 2013

alter database close normal

2、集群日志

000000d400001af4::2013/09/17-07:24:52814 INFO [Qfs] GetDiskFreeSpaceEx Z:\MSCS\, status 0

3、节点1的系统日志

OracleServiceXE 服务处于 停止 状态。

驱动程序在 \Device\Harddisk3 上检测到控制器错误。

驱动程序在 \Device\Harddisk3 上检测到控制器错误。

OracleServiceXE 服务成功发送一个 停止 控件。

OracleOraHome92TNSListener 服务处于 停止 状态。

OracleOraHome92TNSListener 服务成功发送一个 停止 控件。

Cluster Service 服务意外地终止,这种情况已经出现了 1 次。以下的修正 *** 作将在 60000 毫秒内运行: 重新启动服务。

系统未能将数据转储到事务日志。可能出现损坏现象。

还没有作删除准备,设备 'IBM Universal Xport SCSI Disk Device' (SCSI\Disk&Ven_IBM&Prod_Universal_Xport&Rev_0916\5&c756efc&0&00001f) 已从系统中消失。

还没有作删除准备,设备 'IBM 1814 FAStT SCSI Disk Device' (SCSI\Disk&Ven_IBM&Prod_1814______FAStT&Rev_0916\5&c756efc&0&000001) 已从系统中消失。

还没有作删除准备,设备 'IBM 1814 FAStT SCSI Disk Device' (SCSI\Disk&Ven_IBM&Prod_1814______FAStT&Rev_0916\5&c756efc&0&000000) 已从系统中消失。

群集磁盘 '磁盘 Z:' 的保留已丢失。请检查您的 系统和磁盘配置。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

设备 \Device\Harddisk1 的访问功能尚未就绪。

7:29

系统未能将数据转储到事务日志。可能出现损坏现象。

该节点与网络 'heart' 上的群集节点 'M10-HQYZ-DB02' (重新)建立通信。

Cluster Service 服务处于 正在运行 状态。

Network Connections 服务成功发送一个 开始 控件。

9:15

网络 'heart' 上的群集节点 'M10-HQYZ-DB02' 的接口处于运行状态。 该节点可以跟网络上的所有其他可用的群集节点 通信。

事件日志服务已启动。

4、节点2的系统日志

还没有作删除准备,设备 'IBM 1814 FAStT SCSI Disk Device' (SCSI\Disk&Ven_IBM&Prod_1814______FAStT&Rev_0916\5&345104ff&0&000000) 已从系统中消失。

还没有作删除准备,设备 'IBM 1814 FAStT SCSI Disk Device' (SCSI\Disk&Ven_IBM&Prod_1814______FAStT&Rev_0916\5&345104ff&0&000001) 已从系统中消失。

还没有作删除准备,设备 'IBM Universal Xport SCSI Disk Device' (SCSI\Disk&Ven_IBM&Prod_Universal_Xport&Rev_0916\5&345104ff&0&00001f) 已从系统中消失。

该节点与网络 '本地连接' 上的群集节点 'M10-HQYZ-DB01' 失去了通信。

该节点与网络 'heart' 上的群集节点 'M10-HQYZ-DB01' 失去了通信。

由于是磁盘 2 的重复路径,磁盘 5 不会被使用。

由于是磁盘 2 的重复路径,磁盘 5 不会被使用。

由于是磁盘 2 的重复路径,磁盘 5 不会被使用。

系统未能将数据转储到事务日志。可能出现损坏现象。

群集节点 M10-HQYZ-DB01 从活动服务器群集成员身份删除。 群集服务可能已在节点上停止,节点可能出现 故障,或者节点跟其他活动服务器群集节点 失去了通信。

群集服务正在尝试使资源组 "群集组" 联机。

在此群集节点上的群集服务启动之前,MS DTC 服务已启动。此服务将被停止。 如果已将 MSDTC 配置为在群集上运行,则在群集服务启动时,群集服务将使 MS DTC 资源变为联机。错误说明: d:\nt\com\complus\dtc\shared\mtxclu\mtxclusetuphelpercpp:932, Pid: 2992, CmdLine: "C:\WINDOWS\cluster\resrcmonexe" -e 1480 -m 1484 -p 2288

正在停止 MS DTC 服务。

参看集群状态

[11:34:11oracle@node1 ~]crs_stat -t

Name Type Target State Host

------------------------------------------------------------

oradbadb application ONLINE ONLINE node2

oral1inst application ONLINE ONLINE node1

oral2inst application ONLINE ONLINE node2

oradbaraccs application ONLINE ONLINE node2

orall1srv application ONLINE ONLINE node1

orall2srv application ONLINE ONLINE node2

oraSM1asm application ONLINE ONLINE node1

oraE1lsnr application ONLINE ONLINE node1

oranode1gsd application ONLINE ONLINE node1

oranode1ons application ONLINE ONLINE node1

oranode1vip application ONLINE ONLINE node1

oraSM2asm application ONLINE ONLINE node2

oraE2lsnr application ONLINE ONLINE node2

oranode2gsd application ONLINE ONLINE node2

oranode2ons application ONLINE ONLINE node2

oranode2vip application ONLINE ONLINE node2

查看集群资源信息

[12:59:42oracle@node2 ~]srvctl config database -d dba -a

node1 null1 /u01/app/oracle/product/1020/db_1

node2 null2 /u01/app/oracle/product/1020/db_1

DB_NAME: dba

ORACLE_HOME: /u01/app/oracle/product/1020/db_1

SPFILE: +DATA/dba/spfilenullora

DOMAIN: wangcom

DB_ROLE: null

START_OPTIONS: null

POLICY: AUTOMATIC

ENABLE FLAG: DB ENABLED

查看连接信息

[13:01:55oracle@node2 ~]srvctl config database -d dba -t

Example client-side TNS entry for service rac:

rac = (DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=db_vip)(PORT=dedicated_port))(CONNECT_DATA=(SERVICE_NAME=racwangcom)(FAILOVER_MODE=(TYPE=SELECT)(METHOD=BASIC))))

Example client-side TNS entry for service name:

name = (DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=db_vip)(PORT=dedicated_port))(CONNECT_DATA=(SERVICE_NAME=namewangcom)(FAILOVER_MODE=(TYPE=SELECT)(METHOD=BASIC))))

查看服务信息

[13:02:20oracle@node2 ~]srvctl config service -d dba -a

rac PREF: null2 null1 AVAIL: TAF: basic

name PREF: null2 null1 AVAIL: TAF: basic

[13:02:45oracle@node2 ~]srvctl config service -d dba -s rac

rac PREF: null2 null1 AVAIL:

[13:03:01oracle@node2 ~]srvctl config service -d dba -s rac -a

rac PREF: null2 null1 AVAIL: TAF: basic

查看ASM信息

[13:05:41oracle@node2 ~]srvctl config asm -n node1

+ASM1 /u01/app/oracle/product/1020/db_1

[13:05:44oracle@node2 ~]

[13:05:53oracle@node2 ~]srvctl config asm -n node2

+ASM2 /u01/app/oracle/product/1020/db_1

[13:05:56oracle@node2 ~]

查看监听信息

[13:05:57oracle@node2 ~]srvctl config listener -n node2

node2 LISTENER_NODE2

[13:06:15oracle@node2 ~]

[13:06:16oracle@node2 ~]srvctl config listener -n node1

node1 LISTENER_NODE1

查看数据库状态

[13:08:40oracle@node2 ~]srvctl status database -d dba

Instance null1 is running on node node1

Instance null2 is running on node node2

[13:08:43oracle@node2 ~]srvctl status database -d dba -v

Instance null1 is running on node node1 with online services rac name

Instance null2 is running on node node2 with online services rac name

查看监听状态

[13:09:27oracle@node2 ~]srvctl status instance -d dba -i null1,null2

Instance null1 is running on node node1

Instance null2 is running on node node2

[13:09:40oracle@node2 ~]srvctl status instance -d dba -i null1,null2 -v

Instance null1 is running on node node1 with online services rac name

Instance null2 is running on node node2 with online services rac name

查看节点应用状态

[13:10:29oracle@node2 ~]srvctl status nodeapps -n node1

VIP is running on node: node1

GSD is running on node: node1

Listener is running on node: node1

ONS daemon is running on node: node1

[13:11:44oracle@node2 ~]srvctl status nodeapps -n node2

VIP is running on node: node2

GSD is running on node: node2

Listener is running on node: node2

ONS daemon is running on node: node2

查看节点ASM状态

[13:11:47oracle@node2 ~]srvctl status asm -n node1

ASM instance +ASM1 is running on node node1

[13:12:26oracle@node2 ~]srvctl status asm -n node2

ASM instance +ASM2 is running on node node2

测试TAF

设定服务TAF模式为BASIC

RAC =

(DESCRIPTION =

(ADDRESS = (PROTOCOL = TCP)(HOST = node1-vip)(PORT = 1521))

(ADDRESS = (PROTOCOL = TCP)(HOST = node2-vip)(PORT = 1521))

(LOAD_BALANCE = yes)

(CONNECT_DATA =

(SERVER = DEDICATED)

(SERVICE_NAME = racwangcom)

(FAILOVER_MODE =

(TYPE = SELECT)

(METHOD = BASIC)

(RETRIES = 180)

(DELAY = 5)

)

)

)

查看集群状态

[11:55:50oracle@node2 dbs]crs_stat -t

Name Type Target State Host

------------------------------------------------------------

oradbadb application ONLINE ONLINE node2

oranamecs application ONLINE ONLINE node2

orall1srv application ONLINE ONLINE node1

orall2srv application ONLINE ONLINE node2

oral1inst application ONLINE ONLINE node1

oral2inst application ONLINE ONLINE node2

oradbaraccs application ONLINE ONLINE node2

orall1srv application ONLINE ONLINE node1

orall2srv application ONLINE ONLINE node2

oraSM1asm application ONLINE ONLINE node1

oraE1lsnr application ONLINE ONLINE node1

oranode1gsd application ONLINE ONLINE node1

oranode1ons application ONLINE ONLINE node1

oranode1vip application ONLINE ONLINE node1

oraSM2asm application ONLINE ONLINE node2

oraE2lsnr application ONLINE ONLINE node2

oranode2gsd application ONLINE ONLINE node2

oranode2ons application ONLINE ONLINE node2

oranode2vip application ONLINE ONLINE node2

连接数据库进行长事务查询

[11:59:41oracle@node1 ~]sqlplus sys/oracle@rac as sysdba

SQLPlus: Release 102010 - Production on Thu May 27 11:59:56 2010

Copyright (c) 1982, 2005, Oracle All rights reserved

Connected to:

Oracle Database 10g Enterprise Edition Release 102010 - 64bit Production

With the Partitioning, Real Application Clusters, OLAP and Data Mining options

SYS@NODE2:null2>show parameter service_name

NAME TYPE VALUE

------------------------------------ ----------- ------------------------------

service_names string dbawangcom, rac, name

SYS@NODE2:null2>

SYS@NODE2:null2>show parameter db_name;

NAME TYPE VALUE

------------------------------------ ----------- ------------------------------

db_name string dba

SYS@NODE2:null2>

SYS@NODE2:null2>show parameter instance_name;

NAME TYPE VALUE

------------------------------------ ----------- ------------------------------

instance_name string null2

SYS@NODE2:null2>select from dba_objects;

在事务执行过程中关闭当前所连接的实例

[12:00:47oracle@node2 admin]srvctl stop instance -i null2 -d dba -o abort

可观察到该长事务中断若干秒后继续查询

2005-10-22 21:50:51 2005-10-22 21:51:00 2005-10-22:21:50:51 VALID N N N

观察集群状态

[oracle@node1 ~]$ crs_stat -t

Name Type Target State Host

------------------------------------------------------------

oradbadb application ONLINE ONLINE node2

oranamecs application ONLINE ONLINE node2

orall1srv application ONLINE ONLINE node1

orall2srv application ONLINE OFFLINE

oral1inst application ONLINE ONLINE node1

oral2inst application OFFLINE OFFLINE

oradbaraccs application ONLINE ONLINE node2

orall1srv application ONLINE ONLINE node1

orall2srv application ONLINE OFFLINE

oraSM1asm application ONLINE ONLINE node1

oraE1lsnr application ONLINE ONLINE node1

oranode1gsd application ONLINE ONLINE node1

oranode1ons application ONLINE ONLINE node1

oranode1vip application ONLINE ONLINE node1

oraSM2asm application ONLINE ONLINE node2

oraE2lsnr application ONLINE ONLINE node2

oranode2gsd application ONLINE ONLINE node2

oranode2ons application ONLINE ONLINE node2

oranode2vip application ONLINE ONLINE node2

虚拟磁盘共享只解决了两个虚拟机可以同时访问同一块虚拟磁盘的问题。

而文件不同步,这个文件系统层面的东西。相信楼主用的单机的文件系统(EXT3,FAT32,NTFS之类的),不是集群文件系统,(Cluster

File

System,例如Symantec的CFS,SUN的CFS,VMWARE

的VMFS),并不支持多个机器同时访问一个文件系统。

物理机使用共享存储,也是一样的。如果要想同时访问共享设备,那么必须使用集群文件系统或者直接访问裸设备。

例如,MSCS,它就只支持Active/Passive模式,也就是说,同一个文件系统只能在一个节点上使用。

而Symantec(Veritas)

Cluter

File

System和Cluster

Volume

Manager,则可以同时在多个节点上同时使用,支持Active/Active模式,同样的例子还有Oracle

RAC,同一个数据库在多个节点上同时访问

拿oracle为例:

集群是多台服务器共同提供服务,数据库集群的意思就是多台运行数据库服务的服务器组成一个集群。

oracle的集群,自己的是rac,最少需要2台机器,先装cluster或者grid,再在集群上安装数据库,就可以了。

要是db2的话,还得用ibm的 *** 作系统,安装一个集群软件

hacmp等等的。

反正

核心要理解的就是

,做集群,要有集群系统来支撑。例如

,文件同步访问等等的。

rac,hacmp等等的,都属于集群系统!

配置Windows2003集群 默认分类 2008-03-09 23:57 阅读656 评论0 字号: 大 大 中 中 小 小 集群是在一组计算机上运行相同的软件并虚拟成一台主机系统为客户端与应用提供服务;计算机通过缆线物理连接并通过集群软件实现程序上的连接,可以使计算机实现单机无法实现的容错和负载均衡。集群技术在企业组织部署关键业务、电子商务与商务流程应用等领域,具有举足轻重的作用。 本文主要带领大家一起,参与到基于Windows2003 *** 作系统的集群配置中来,从以下的配置过程中,希望读者朋友能切实了解到Windows2003集群技术在Windows2003中的具体应用。 一、总体情况 Windows Server 2003的企业版和Datacenter版都可以支持最大达8个节点的集群配置;其典型的特征是可为数据库、消息系统、文件与打印服务这些关键业务应用,提供高可用性和可扩展性,在集群中的多个服务器(节点)保持不间断的联系。即是说如果在集群中的某一节点因出错或维护不可用时,另一节点会立刻提供服务,以实现容错。正在访问服务的用户可以继续访问,而不会察觉到服务已经由另一台服务器(节点)提供。 二、安装前准备 集群服务作为Windows Server 2003 *** 作系统的一个主要部分,不再是一个可选的组件。以下配置过程主要分为“安装前准备”、“服务安装”以及“创建集群”三方面进行。 在这一步中,主要明白在软、硬件方面都应作怎样的准备,才能让集群服务正常安装并运行起来。首先在软件方面,要求群集中的所有计算机上均安装有Windows Server 2003 *** 作系统;需要有一个域名解析系统;所有的节点必须是同一个域的成员,需要一个域级账户,而且要是每个节点上的本地管理员组的成员。 硬件方面,要求群集中的每个节点拥有两块网卡;每个节点上的所有网络界面均拥有静态IP地址;一个唯一的NetBIOS名称;群集磁盘上的所有分区必须格式化为NTFS等等。 三、服务安装 在第一个节点上开始安装群集服务前,必须先在每一个群集节点上执行以下步骤: 在每个节点上安装 Windows Server 2003 *** 作系统。 设置网络。 设置磁盘。 提示:要配置群集服务,您必须以一个具有所有节点管理权限的账户登录。每个节点都必须是同一个域的成员。如果您选择将其中一个节点作为域控制器,则应在相同的子网上再设置一个域控制器,以便消除单点故障,并对该节点进行维护。 关于Windows 2003 *** 作系统的具体安装过程,这里不再详述,大家可以参考Microsoft相关技术文档。这里主要介绍余下两步。 1:设置网络 每个群集节点要求至少要有两块网卡用于两个或多个独立网络,以避免单点故障。其中一个网络适配器用于连接到公用网络,而另一个则用于连接到仅由群集节点组成的专用网络。拥有多个网络适配器的服务器被称为“多宿主”。在这部分的网络配置中,可从以下几方面进行。 规划好两块网卡的名称 依次在“控制面板/网络连接”中,右击本地连接的网卡图标,选择“重命名”命令,将此连接命名为“专用”;然后将另一个网卡连接图标命名为“公用”。新的连接名称将出现在“群集管理器”中,并将在联机时自动复制到其他所有的群集节点。 确定绑定的顺序网络 在“网络连接”窗口内,依次单击主菜单上的“高级/高级设置”命令,在d出的窗口中确定顺序为公用、专用和远程访问连接,如图1所示。 图1 配置专用连接属性 步骤1:在网络连接窗口中,右键单击专用连接图标,选择属性命令。 步骤2:在“常规选”项卡下,清除所有其他客户端、服务和协议的复选框,确认只勾选了“Internet 协议 (TCP/IP)” 复选框,如图 2 所示。 图2 步骤3:在图3中单击右上角“配置”按钮,打开如图3所示界面后,在“高级”选项卡下,为网卡选择一个合适的传输速度值;建议将同一路径上的所有设备设定为 10 兆字节每秒 (Mbps) 和半双工,即保证集群环境内所有网卡速率保持一致。 图3 步骤4:配置专用网络网卡地址。在图2所示界面中双击“Internet 协议 (TCP/IP)”,在打开的如图4所示IP地址配置界面中,为专用网络的网卡配置唯一的IP地址。比如可将10000 到 10255255255 (A 类)的地址段作为集群环境的专用IP地址段。 图4 步骤5:然后单击IP地址配置界面右下角的“高级”按钮。确保清除了在 DNS 中注册此连接的地址和在 DNS 注册中使用此连接的 DNS 后缀复选框;然后切换到“WINS”选项卡,勾选“禁用TCP/IP上的NetBIOS”选项,如图5所示。 图5 提示:以上三方面的内容在群集中的所有其他节点上,都应进行同样的设置。 设置群集用户账户 群集服务需要一个域用户账户,该账户应为每个可运行群集服务的节点上的“本地管理员”组成员。因为安装需要用户名和密码,所以该用户账户必须在配置群集服务前予以创建。该用户账户只能专门用于运行群集服务,而不能属于个人。 依次单击“开始/程序/管理工具/ Active Directory 用户和计算机”后,即可开始创建过程。注意最后在“Active Directory 用户和计算机”管理单元的左侧窗格中,右击群集后选择将成员添加到组;然后单击管理员,这样将给予新用户账户在该计算机上的管理特权。 2:设置磁盘 设置磁盘时注意,为了避免破坏群集磁盘,在其他节点上启动 *** 作系统前,确认至少在一个节点上安装、配置并运行了 Windows Server 2003 和群集服务。在完成群集服务配置之前,所开启的节点数不要超过一个,这一点至关重要。 创建仲裁磁盘 仲裁磁盘用于存储群集配置数据库检查点和日志文件,日志文件可协助管理群集和维护一致性。一般情况下应创建一个最小 50 MB 的逻辑驱动器用来作为仲裁磁盘。 配置共享磁盘 共享磁盘的配置,主要是从硬盘空余空间中分配一个仲裁磁盘和最少一个数据磁盘出来,用于集群管理(最好再加装一块硬盘,专用于集群);然后右击磁盘分区,选择“格式化”命令;接着在如图6所示窗口中,在卷标框中,键入该磁盘的名称;然后选择“NTFS”文件系统;最后单击“确定”按钮即可。 图6 提示:为共享磁盘分配驱动器卷标至关重要,因为在还原磁盘时这会大大减少故障排除时间。 四、创建集群 通过以上准备工作后,即可开始集群的创建。 *** 作步骤如下所示: 步骤1:依次单击“开始/程序/管理工具/群集管理器”选项,然后打开如图7所示对话框;从下拉列表中选择“创建新群集”。 图7 步骤2:然后会d出群集创建的向导,单击“下一步”后,在如图8所示设置窗口中,输入域名及集群名后单击“下一步”按钮。 图8 步骤3:然后输入将要作为第一个节点创建群集的服务器的名称,如图9所示。 提示:如果在本地使用一个不属于具有本地管理特权的域帐户的账户登录,向导将提示您指定一个新账户。这不是启动群集服务所用的帐户。 图9 步骤4:接着会d出如图10所示界面。这里是在查找可能导致安装出现问题的硬件或软件问题。检 查所有警告或错误信息。您还可以单击详细信息按钮,了解有关每个警告或提示的详细信息。 图10 步骤5:接着会提示输入唯一的群集 IP 地址。创建向导在这当中通过使用子网掩码选择正确的网络,自动与其中一个公用网络关联群集 IP 地址。这里提醒大家注意:群集 IP 地址只能用于管理,而不能用于客户端连接。 步骤6:然后输入在预安装时创建的群集服务账户的用户名和密码,并选择好域名;此时群集配置向导将验证用户账户和密码。 步骤7:然后是一些确认页面,一切无误后,即可在最后的窗口中单击“完成”按钮;最后的群集管理器配置完成窗口如图11所示。 图11 五、后记 Windows Server 2003 家族提供了两种类型的集群服务:服务器集群和网络负载均衡。在以上部分中,重点给大家介绍了服务器集群从准备到安装的全过程,而网络负载均衡却并没有过多的涉及,其实该服务的功能也是强大且实有的,它有效增强了Web服务器、流媒体服务器、终端服务器等Internet服务器程序的可用性和扩展性;可与现存Web服务器群结构无缝集成。

以上就是关于请教如何查找windows集群发生切换的原因全部的内容,包括:请教如何查找windows集群发生切换的原因、windows oracle 怎么查看集群状态、vmware的windows2003群集共享磁盘数据无法同步的问题等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/sjk/10120006.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-05
下一篇2023-05-05

发表评论

登录后才能评论

评论列表(0条)

    保存