Task 13959310

Name	hadcm3n_o2ws_1980_40_007694625_2
Workunit	7849733
Created	24 Jan 2012, 2:14:31 UTC
Sent	24 Jan 2012, 2:17:17 UTC
Report deadline	24 Apr 2012, 9:44:28 UTC
Received	18 Feb 2012, 22:10:52 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1028748
Run time	13 days 16 hours 49 min 13 sec
CPU time	11 days 1 hours 20 min 54 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.25 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:27:46 (5200): No heartbeat from core client for 30 sec - exiting 21:27:47 (5200): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 20:14:57 (4640): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:00:27 (792): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2796, iMonCtr=1 Model crash detected, will try to restart... 16:18:07 (2724): No heartbeat from core client for 30 sec - exiting 16:18:08 (2724): No heartbeat from core client for 30 sec - exiting 16:18:09 (2724): No heartbeat from core client for 30 sec - exiting 16:18:10 (2724): No heartbeat from core client for 30 sec - exiting 16:18:11 (2724): No heartbeat from core client for 30 sec - exiting 16:18:12 (2724): No heartbeat from core client for 30 sec - exiting 16:18:13 (2724): No heartbeat from core client for 30 sec - exiting 16:18:14 (2724): No heartbeat from core client for 30 sec - exiting 16:18:15 (2724): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:11:17 (5192): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2068, iMonCtr=1 Model crash detected, will try to restart... 20:51:22 (4400): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:03:44 (4632): No heartbeat from core client for 30 sec - exiting 21:03:45 (4632): No heartbeat from core client for 30 sec - exiting 21:03:46 (4632): No heartbeat from core client for 30 sec - exiting 21:03:47 (4632): No heartbeat from core client for 30 sec - exiting 21:03:48 (4632): No heartbeat from core client for 30 sec - exiting 21:03:49 (4632): No heartbeat from core client for 30 sec - exiting 21:03:50 (4632): No heartbeat from core client for 30 sec - exiting 21:03:51 (4632): No heartbeat from core client for 30 sec - exiting 21:03:52 (4632): No heartbeat from core client for 30 sec - exiting 21:03:53 (4632): No heartbeat from core client for 30 sec - exiting 21:03:54 (4632): No heartbeat from core client for 30 sec - exiting 21:03:55 (4632): No heartbeat from core client for 30 sec - exiting 21:03:56 (4632): No heartbeat from core client for 30 sec - exiting 21:03:57 (4632): No heartbeat from core client for 30 sec - exiting 21:03:58 (4632): No heartbeat from core client for 30 sec - exiting 21:03:59 (4632): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:04:00 (4632): No heartbeat from core client for 30 sec - exiting 21:04:01 (4632): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1460, iMonCtr=1 Model crash detected, will try to restart... 13:37:11 (5428): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:47:54 (6028): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:41:09 (5260): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:49:01 (5408): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:45:26 (4916): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:46:12 (6628): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:35:34 (3404): No heartbeat from core client for 30 sec - exiting 19:35:35 (3404): No heartbeat from core client for 30 sec - exiting 19:35:36 (3404): No heartbeat from core client for 30 sec - exiting 19:35:37 (3404): No heartbeat from core client for 30 sec - exiting 19:35:38 (3404): No heartbeat from core client for 30 sec - exiting 19:35:39 (3404): No heartbeat from core client for 30 sec - exiting 19:35:40 (3404): No heartbeat from core client for 30 sec - exiting 19:35:41 (3404): No heartbeat from core client for 30 sec - exiting 19:35:42 (3404): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:35:43 (3404): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5584, iMonCtr=1 Model crash detected, will try to restart... 19:54:12 (3608): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 21:06:50 (384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:37:25 (5628): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:54:22 (4524): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x76F53AB3 read attempt to address 0x40BE5879 Engaging BOINC Windows Runtime Debugger... Worker:: CPDN process is not running, exiting, bRetVal = 0, checkPID=0, selfPID=0, iMonCtr=0 Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x76F53AB3 read attempt to address 0x40BE5879 Engaging BOINC Windows Runtime Debugger... Cannot serialize file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o2ws_1980_40_007694625/dataout/shmem_restart.day Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Feb 2012 09:10:46	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	518,400	921,916	1.7784
17 Feb 2012 16:54:39	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	492,480	875,892	1.7785
17 Feb 2012 01:47:58	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	466,560	830,042	1.7791
16 Feb 2012 10:51:12	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	440,640	784,053	1.7794
15 Feb 2012 17:39:39	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	414,720	738,580	1.7809
15 Feb 2012 01:26:25	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	388,800	692,964	1.7823
14 Feb 2012 08:55:28	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	362,880	647,191	1.7835
13 Feb 2012 15:47:25	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	336,960	601,205	1.7842
12 Feb 2012 23:59:31	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	311,040	555,019	1.7844
12 Feb 2012 07:07:08	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	285,120	508,824	1.7846
11 Feb 2012 16:48:36	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	259,200	462,661	1.7850
11 Feb 2012 01:41:23	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	233,280	416,818	1.7868
10 Feb 2012 08:12:36	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	207,360	370,457	1.7865
09 Feb 2012 16:14:00	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	181,440	323,998	1.7857
09 Feb 2012 00:26:48	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	155,520	277,524	1.7845
07 Feb 2012 21:24:13	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	129,600	231,379	1.7853
07 Feb 2012 03:30:54	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	103,680	185,302	1.7872
06 Feb 2012 11:29:02	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	77,760	139,032	1.7880
05 Feb 2012 03:08:59	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	51,840	92,715	1.7885
04 Feb 2012 05:02:21	1028748	13959310	hadcm3n_o2ws_1980_40_007694625_2	25,920	46,606	1.7981